Wan 2.1 & WanX 2.1 & Wan AI
O que é Wan 2.1 da Wan AI?
Wan AI é um modelo de geração visual avançado e poderoso desenvolvido pelo Tongyi Lab. Ele pode gerar vídeos com base em texto, imagens e outros sinais de controle. Os modelos da série Wan 2.1 agora são totalmente open-source.Explore exemplos
Visão Geral do Wan AI
Desempenho SOTA
Wan 2.1 consistentemente supera os modelos open-source existentes e soluções comerciais de última geração em múltiplos benchmarks.
Suporta GPUs de Consumo
O modelo T2V-1.3B requer apenas 8.19 GB de VRAM, tornando-o compatível com quase todas as GPUs de consumo. Ele pode gerar um vídeo de 5 segundos em 480P em uma RTX 4090 em cerca de 4 minutos (sem técnicas de otimização como quantização). Seu desempenho é até comparável a alguns modelos de código fechado.
Múltiplas Tarefas
Wan 2.1 se destaca em Texto para Vídeo, Imagem para Vídeo, Edição de Vídeos, Texto para Imagem e Vídeo para Áudio, avançando no campo de geração de vídeos.
Geração de Texto Visual
Wan 2.1 é o primeiro modelo de vídeo capaz de gerar texto tanto em chinês quanto em inglês, com uma geração de texto robusta que melhora suas aplicações práticas.
Potente VAE de Vídeo do Wan AI
Wan-VAE oferece eficiência e desempenho excepcionais, codificando e decodificando vídeos de 1080P de qualquer comprimento enquanto preserva informações temporais, tornando-o uma base ideal para geração de vídeos e imagens.
Recursos do Wan AI
Movimentos Complexos
Excelente na geração de vídeos realistas com movimentos corporais extensos, rotações complexas, transições de cenas dinâmicas e movimentos de câmera fluidos.
Simulação Física
Gera vídeos que simulam com precisão a física do mundo real e interações realistas de objetos.
Qualidade Cinematográfica
Oferece visuais de qualidade cinematográfica com texturas ricas e uma variedade de efeitos estilizados.
Edição Controlável pelo Wan AI
Conta com um modelo de edição universal para edições precisas usando referências de imagens ou vídeos.
Geração de Texto Visual pelo Wan AI
Cria texto e efeitos de texto dinâmicos em vídeos diretamente a partir de prompts de texto.
Corrida 8-Bit
Prompt: Uma animação de introdução de corrida de carros em estilo retro de 8 bits. Carros musculosos pixelados, cada um com designs e cores distintos, alinham-se em uma linha de partida em uma vasta paisagem deserta pixelada. O texto grande e pixelado "WANX RACING" pisca acima dos carros em cores neon vibrantes, lembrando os títulos dos jogos de arcade clássicos. A câmera percorre a cena, destacando a estética retro e o texto. O fundo apresenta uma simples paisagem deserta pixelada com um pôr do sol em blocos lançando tons dourados quentes sobre a cena. Todo o ambiente está banhado em cores neon pixeladas vibrantes, realçando a sensação nostálgica.
Feliz Natal
Prompt: Cena de festa de Natal realista e lindamente decorada, árvores de Natal adornadas com luzes coloridas e presentes, chamas dançando na lareira, pessoas de gengibre usando chapéus de Natal dançando ao redor da árvore, e mesas cheias de peru assado e outras delícias. Efeitos de texto exquisitos aparecem na tela: "Feliz Natal!" A tela é exquisita, sofisticada e concisa.
Corrida Louca
Prompt: Sequência de títulos de filme de ação fictício em estilo retro dos anos 70. O texto estilizado e desenhado à mão "WANX" aparece dinamicamente na tela, sobreposto a clipes de ritmo acelerado de perseguições de carros, explosões e acrobacias ousadas. O texto é ousado, cru e ligeiramente distorcido, refletindo a estética dos filmes de ação dos anos 70. Uma montagem de cenas de alta intensidade com um efeito de grão de filme retro, com cores vintage quentes. As sequências são banhadas em uma luz de hora dourada, realçando a sensação nostálgica.
Efeitos Sonoros e Música
Gera efeitos sonoros e música de fundo que se alinham perfeitamente com o conteúdo visual e o ritmo.
Furões Entrando na Água
Prompt: A câmera se move rapidamente de longe para perto, com uma visão baixa, em pé sobre um tronco. Na visão distante, um furão branco aparece repentinamente, brincando com o tronco e pulando na água, depois nadando para fora da água e colocando a cabeça para fora. Neste momento, a câmera faz um zoom para mostrar um close-up do furão branco. Várias árvores de bagas ao lado dele estão salpicadas de água, musgo e neve cobrem o chão, e a superfície da água está coberta por folhas verdes caídas. O fundo é de bétula branca.
Concerto do Wan AI
Prompt: Um grupo de pessoas executa uma sinfonia no Salão de Viena.
Gelo Caindo
Prompt: Um grupo de pessoas executa uma sinfonia no Salão de Viena.
Recursos do Produto
Através do nosso produto, você pode aproveitar nossos modelos de maneira fluida com uma experiência de usuário amigável para acessar conteúdo de vídeo inspirador.
Wan AI Código Aberto
Neste repositório, publicamos o código e os pesos para Wan2.1, uma suíte completa e aberta de modelos de fundamentos de vídeo projetados para ampliar os limites da geração de vídeos.
O modelo I2V-14B supera os modelos de código fechado líderes, bem como todos os modelos open-source existentes, alcançando desempenho SOTA. É capaz de gerar vídeos que demonstram cenas visuais complexas e padrões de movimento com base em texto e imagens de entrada, incluindo modelos de resolução 480P e 720P.
Wan2.1-T2V-14B
😊480-720PO modelo T2V-14B estabelece um novo desempenho SOTA entre modelos open-source e fechados, mostrando sua capacidade de gerar visuais de alta qualidade com dinâmica de movimento substancial. Também é o único modelo de vídeo capaz de produzir texto tanto em chinês quanto em inglês e suporta a geração de vídeos em resoluções 480P e 720P.
Wan2.1-T2V-1.3B
😊480PO modelo T2V-1.3B suporta a geração de vídeos em quase todas as GPUs de consumo, exigindo apenas 8.19 GB de BRAM para produzir um vídeo de 5 segundos em 480P, com um tempo de saída de apenas 4 minutos em uma GPU RTX 4090. Através de processos de pré-treinamento e destilação, supera modelos open-source maiores e alcança desempenho até comparável a alguns modelos de código fechado avançados.
Wan2.1-FLF2V-14B-720P
Wan 2.1 First-Last-Frame-to-Video (FLF2V) é uma tecnologia de geração de vídeo baseada em IA que sintetiza quadros intermediários entre um quadro inicial e final fornecidos para produzir vídeos suaves. Utiliza um modelo de 14B parâmetros, suporta inferência acelerada por múltiplas GPUs e oferece checkpoints pré-treinados com uma demo Gradio para testes interativos. As aplicações incluem inpainting de vídeo, produção de animação e mais.
Relatório Técnico
Fique atento à próxima publicação do nosso relatório técnico completo para mais detalhes.
Com base no paradigma do transformador de difusão mainstream, Wan 2.1 alcança avanços significativos em capacidades gerativas através de uma série de inovações, incluindo nosso novo autoencoder variacional espaço-temporal (VAE), estratégias de pré-treinamento escaláveis, construção de dados em larga escala e métricas de avaliação automatizadas. Essas contribuições melhoram coletivamente o desempenho e a versatilidade do modelo.
Por que Escolher Wan AI?
Experimente o futuro da geração de vídeo AI com tecnologia líder do setor e recursos incomparáveis.
Saída de Ultra Alta Qualidade
Gere vídeos de qualidade cinematográfica com detalhes realistas e simulação física precisa.
Controle Avançado de Movimento
Manipule movimentos complexos, rotações e dinâmica corporal natural sem problemas.
Suporte Global de Idiomas
Crie vídeos com efeitos de texto multilíngues para públicos mundiais.
Processamento Ultra-Rápido
Alimentado por VAE causal 3D de próxima geração para geração ilimitada de vídeo 1080P.
Excelência Acessível
Produção de vídeo profissional por uma fração dos custos tradicionais.
Perguntas Frequentes
O que é Wan 2.1 da Wan AI e como funciona?
Wan 2.1 da Wan AI é o modelo de geração de vídeos de última geração da Alibaba Cloud que transforma descrições de texto em vídeos impressionantes de alta qualidade. Utilizando tecnologias avançadas como Autoencoders Variacionais (VAE) e Transformadores de Difusão (DiT), garante visuais realistas, transições suaves e física precisa para uma experiência verdadeiramente imersiva.
Preciso de experiência técnica para usar Wan 2.1 da Wan AI?
Wan 2.1 da Wan AI é projetado pensando na simplicidade. Sua interface intuitiva permite que qualquer pessoa crie vídeos de qualidade profissional sem esforço, mesmo sem habilidades técnicas avançadas. Seja você um iniciante ou um profissional, encontrará a plataforma fácil de navegar e usar.
Que tipos de vídeos posso criar com Wan 2.1 da Wan AI?
Wan 2.1 da Wan AI é versátil e capaz de gerar uma ampla gama de conteúdo de vídeo. Desde cenas dinâmicas como danças e esportes até tutoriais educacionais e restauração de vídeos históricos, permite que você dê vida à sua visão criativa.
Quanto tempo leva para gerar um vídeo?
O tempo de geração do vídeo depende da complexidade e da duração do seu projeto. Para resultados mais rápidos, a versão Pro oferece velocidades de processamento aceleradas, ideal para tarefas sensíveis ao tempo.
Posso personalizar a saída do vídeo?
Absolutamente! Wan 2.1 da Wan AI oferece amplas opções de personalização, permitindo que você ajuste a resolução, a taxa de quadros, a complexidade do movimento e muito mais. Adapte seus vídeos para atender às suas necessidades e preferências específicas.
Quais formatos de entrada Wan 2.1 da Wan AI suporta para geração de vídeos?
Wan 2.1 da Wan AI suporta principalmente descrições de texto como entrada para geração de vídeos. Você pode fornecer prompts de texto detalhados que descrevem a cena, as ações e os efeitos visuais desejados. Além disso, pode suportar entradas de imagem para um contexto aprimorado em atualizações futuras.
Wan 2.1 da Wan AI pode gerar vídeos em múltiplos idiomas?
Sim, Wan 2.1 da Wan AI suporta entradas de texto multilíngues, permitindo que você gere vídeos com base em descrições em vários idiomas. No entanto, a qualidade da saída pode variar dependendo do idioma e da complexidade da descrição.
Há um limite para a duração dos vídeos que Wan 2.1 da Wan AI pode gerar?
A duração dos vídeos gerados depende do plano de assinatura. A versão gratuita pode ter limitações na duração do vídeo, enquanto a versão Pro suporta a geração de vídeos mais longos e complexos. Limites específicos podem ser encontrados na documentação da plataforma.
Como Wan 2.1 da Wan AI garante a qualidade dos vídeos gerados?
Wan 2.1 da Wan AI utiliza tecnologias avançadas como Autoencoders Variacionais (VAE) e Transformadores de Difusão (DiT) para garantir saídas de alta qualidade. Essas tecnologias permitem visuais realistas, transições suaves e simulações precisas de física.
Como Wan 2.1 da Wan AI lida com cenas complexas com múltiplos personagens?
Wan 2.1 da Wan AI é projetado para lidar com cenas complexas com múltiplos personagens analisando as relações e interações descritas na entrada de texto. Ele usa algoritmos avançados para garantir um posicionamento, movimentos e interações realistas entre os personagens.