Wan 2.1 & WanX 2.1 & Wan AI
O que é Wan 2.1 da Wan AI?
Wan AI é um modelo avançado e poderoso de geração visual desenvolvido pelo Laboratório Tongyi. Ele pode gerar vídeos com base em texto, imagens e outros sinais de controle. Os modelos da série Wan 2.1 agora são totalmente de código aberto.Terokai contoh
Visão Geral do Wan AI
Desempenho SOTA
Wan 2.1 supera consistentemente os modelos de código aberto existentes e as soluções comerciais mais avançadas em vários benchmarks.
Suporta GPUs de Consumo
O modelo T2V-1.3B requer apenas 8,19 GB de VRAM, tornando-o compatível com quase todas as GPUs de consumo. Ele pode gerar um vídeo de 5 segundos em 480P em uma RTX 4090 em cerca de 4 minutos (sem técnicas de otimização como quantização). Seu desempenho é comparável a alguns modelos de código fechado.
Múltiplas Tarefas
Wan 2.1 se destaca em Texto para Vídeo, Imagem para Vídeo, Edição de Vídeo, Texto para Imagem e Vídeo para Áudio, avançando o campo da geração de vídeo.
Geração de Texto Visual
Wan 2.1 é o primeiro modelo de vídeo capaz de gerar texto em chinês e inglês, com geração de texto robusta que amplia suas aplicações práticas.
Poderoso Video VAE do Wan AI
Wan-VAE oferece eficiência e desempenho excepcionais, codificando e decodificando vídeos 1080P de qualquer duração, preservando informações temporais, tornando-o uma base ideal para geração de vídeo e imagem.
Recursos do Wan AI
Movimentos Complexos do Wan AI
Destaca-se na geração de vídeos realistas com movimentos corporais extensos, rotações complexas, transições de cena dinâmicas e movimentos fluidos de câmera.
Simulação Física do Wan AI
Gera vídeos que simulam com precisão a física do mundo real e interações realistas de objetos.
Qualidade Cinematográfica do Wan AI
Oferece visuais cinematográficos com texturas ricas e uma variedade de efeitos estilizados.
Edição Controlável do Wan AI
Possui um modelo de edição universal para edições precisas usando referências de imagem ou vídeo.
Geração de Texto Visual do Wan AI
Cria texto e efeitos de texto dinâmicos em vídeos diretamente a partir de prompts de texto.
Corrida 8-Bit
Prompt: Uma animação estilo 8-bit retrô de uma introdução de corrida de carros. Carros muscle pixelados, cada um com cores e designs distintos, alinhados na linha de partida em uma vasta paisagem desértica pixelada. Um grande texto pixelado "WANX RACING" pisca acima dos carros em cores neon vibrantes, reminiscente de títulos de jogos de arcade clássicos. A câmera faz uma panorâmica pela cena, destacando a estética retrô e o texto. O fundo apresenta uma paisagem desértica pixelada simples com um pôr do sol em blocos lançando tons quentes e dourados sobre a cena. Todo o ambiente é banhado por cores neon vibrantes e pixeladas, aumentando a sensação nostálgica.
Feliz Natal
Prompt: Cena realista de uma festa de Natal decorada, árvores de Natal adornadas com luzes coloridas e presentes, chamas dançando na lareira, bonecos de gengibre usando chapéus de Natal dançando ao redor da árvore, e mesas cheias de peru assado e outras iguarias. Efeitos de texto requintados aparecem na tela: "Feliz Natal!" A tela é requintada, sofisticada e concisa.
Corrida Louca
Prompt: Uma sequência de título estilo anos 70 para um filme de ação fictício. Texto estilizado e desenhado à mão "WANX" aparece dinamicamente na tela, sobreposto a clipes acelerados de perseguições de carros, explosões e acrobacias ousadas. O texto é ousado, áspero e levemente distorcido, refletindo a estética dos filmes de ação dos anos 70. Uma montagem de cenas de alta octanagem com um efeito de grão de filme retrô, apresentando cores quentes e vintage. As sequências são banhadas pela luz do pôr do sol, aumentando a sensação nostálgica.
Efeitos Sonoros e Música do Wan AI
Gera efeitos sonoros e música de fundo que se alinham perfeitamente com o conteúdo visual e o ritmo.
Furões Entrando na Água
Prompt: A câmera se move rapidamente de longe para perto, com um ângulo baixo de visão, em pé em um tronco. Na visão distante, um furão branco aparece repentinamente, brincando com o tronco e pulando na água, depois nadando para fora da água e colocando a cabeça para fora. Neste momento, a câmera se aproxima para mostrar um close-up do furão branco. Várias árvores de bagas próximas são salpicadas de água, musgo e neve cobrem o chão, e a superfície da água é coberta por folhas verdes caídas. O fundo é de bétulas brancas.
Concerto do Wan AI
Prompt: Um grupo de pessoas está realizando uma sinfonia no Salão de Viena.
Queda de Gelo
Prompt: Um grupo de pessoas está realizando uma sinfonia no Salão de Viena.
Recursos do Produto
Através do nosso produto, você pode aproveitar nossos modelos de forma contínua com uma experiência amigável para acessar conteúdo de vídeo inspirador.
Wan AI de Código Aberto
Neste repositório, lançamos o código e os pesos para o Wan 2.1, um conjunto abrangente e aberto de modelos de base de vídeo projetados para expandir os limites da geração de vídeo.
O modelo I2V-14B supera os modelos líderes de código fechado, bem como todos os modelos de código aberto existentes, alcançando desempenho SOTA. Ele é capaz de gerar vídeos que demonstram cenas visuais complexas e padrões de movimento com base em texto e imagens de entrada, incluindo modelos de resolução 480P e 720P.
Wan2.1-T2V-14B
😊480-720PO modelo T2V-14B estabelece um novo desempenho SOTA entre modelos de código aberto e fechado, mostrando sua capacidade de gerar visuais de alta qualidade com dinâmicas de movimento substanciais. Ele também é o único modelo de vídeo capaz de produzir texto em chinês e inglês e suporta geração de vídeo em resoluções 480P e 720P.
Wan2.1-T2V-1.3B
😊480PO modelo T2V-1.3B suporta geração de vídeo em quase todas as GPUs de consumo, exigindo apenas 8,19 GB de BRAM para produzir um vídeo de 5 segundos em 480P, com um tempo de saída de apenas 4 minutos em uma GPU RTX 4090. Através de processos de pré-treinamento e destilação, ele supera modelos de código aberto maiores e alcança desempenho comparável a alguns modelos de código fechado avançados.
Wan2.1-FLF2V-14B-720P
Wan 2.1 First-Last-Frame-to-Video (FLF2V) adalah teknologi penjanaan video berasaskan AI yang mensintesis bingkai pertengahan antara bingkai mula dan akhir yang diberikan untuk menghasilkan video yang lancar. Ia menggunakan model parameter 14B, menyokong inferens dipercepatkan pelbagai GPU, dan menawarkan titik semak yang telah dilatih dengan demo Gradio untuk ujian interaktif. Aplikasi termasuk inpainting video, pengeluaran animasi, dan banyak lagi.
Laporan Teknikal
Fique atento para o próximo lançamento do nosso relatório técnico abrangente para mais detalhes.
Baseado no paradigma mainstream de transformadores de difusão, o Wan 2.1 alcança avanços significativos em capacidades generativas através de uma série de inovações, incluindo nosso novo autoencoder variacional espaço-temporal (VAE), estratégias de pré-treinamento escaláveis, construção de dados em larga escala e métricas de avaliação automatizadas. Essas contribuições coletivamente melhoram o desempenho e a versatilidade do modelo.
Mengapa Memilih Wan AI?
Alami masa depan penjanaan video AI dengan teknologi terkemuka industri dan keupayaan yang tiada tandingan.
Output Kualiti Ultra-Tinggi
Jana video berkualiti sinematik dengan perincian realistik dan simulasi fizik yang tepat.
Kawalan Pergerakan Lanjutan
Kendalikan pergerakan kompleks, putaran, dan dinamik badan semula jadi dengan lancar.
Sokongan Bahasa Global
Cipta video dengan kesan teks pelbagai bahasa untuk penonton seluruh dunia.
Pemprosesan Kilat
Dikuasakan oleh VAE kausal 3D generasi seterusnya untuk penjanaan video 1080P tanpa had.
Kecemerlangan Berpatutan
Pengeluaran video gred profesional pada sebahagian kecil kos tradisional.
Perguntas Frequentes
O que é Wan 2.1 da Wan AI e como funciona?
Wan 2.1 da Wan AI é o modelo de geração de vídeo de última geração da Alibaba Cloud que transforma descrições de texto em vídeos impressionantes e de alta qualidade. Utilizando tecnologias avançadas como Autoencoders Variacionais (VAE) e Transformadores de Difusão (DiT), ele garante visuais realistas, transições suaves e física precisa para uma experiência verdadeiramente imersiva.
Preciso de conhecimentos técnicos para usar o Wan 2.1 da Wan AI?
Wan 2.1 da Wan AI foi projetado com simplicidade em mente. Sua interface intuitiva permite que qualquer pessoa crie vídeos de qualidade profissional sem esforço, mesmo sem habilidades técnicas avançadas. Seja você um iniciante ou um profissional, encontrará a plataforma fácil de navegar e usar.
Que tipos de vídeos posso criar com o Wan 2.1 da Wan AI?
Wan 2.1 da Wan AI é versátil e capaz de gerar uma ampla gama de conteúdos de vídeo. Desde cenas dinâmicas como dança e esportes até tutoriais educacionais e restauração de vídeos históricos, ele permite que você dê vida à sua visão criativa.
Berapa lama masa yang diambil untuk menjana video?
Masa penjanaan video bergantung pada kerumitan dan panjang projek anda. Untuk hasil yang lebih pantas, versi Pro menawarkan kelajuan pemprosesan yang dipercepatkan, menjadikannya sesuai untuk tugas yang sensitif terhadap masa.
Bolehkah saya menyesuaikan output video?
Sudah tentu! Wan 2.1 oleh Wan AI menyediakan pilihan penyesuaian yang luas, membolehkan anda menyesuaikan resolusi, kadar bingkai, kerumitan pergerakan, dan banyak lagi. Sesuaikan video anda untuk memenuhi keperluan dan keutamaan khusus anda.
Apakah format input yang disokong oleh Wan 2.1 oleh Wan AI untuk penjanaan video?
Wan 2.1 oleh Wan AI terutamanya menyokong deskripsi teks sebagai input untuk penjanaan video. Anda boleh memberikan petunjuk teks terperinci yang menerangkan adegan, tindakan, dan kesan visual yang diinginkan. Selain itu, ia mungkin menyokong input imej untuk konteks yang lebih baik dalam kemas kini masa depan.
Bolehkah Wan 2.1 oleh Wan AI menjana video dalam pelbagai bahasa?
Ya, Wan 2.1 oleh Wan AI menyokong input teks multibahasa, membolehkan anda menjana video berdasarkan deskripsi dalam pelbagai bahasa. Walau bagaimanapun, kualiti output mungkin berbeza bergantung pada bahasa dan kerumitan deskripsi.
Adakah had untuk panjang video yang boleh dijana oleh Wan 2.1 oleh Wan AI?
Panjang video yang dijana bergantung pada pelan langganan. Versi percuma mungkin mempunyai had pada tempoh video, manakala versi Pro menyokong penjanaan video yang lebih panjang dan kompleks. Had khusus boleh didapati dalam dokumentasi platform.
Bagaimanakah Wan 2.1 oleh Wan AI memastikan kualiti video yang dijana?
Wan 2.1 oleh Wan AI menggunakan teknologi canggih seperti Autoencoder Variasional (VAE) dan Transformer Difusi (DiT) untuk memastikan output berkualiti tinggi. Teknologi ini membolehkan visual yang realistik, peralihan yang lancar, dan simulasi fizik yang tepat.
Bagaimanakah Wan 2.1 oleh Wan AI mengendalikan adegan kompleks dengan pelbagai watak?
Wan 2.1 oleh Wan AI direka untuk mengendalikan adegan kompleks dengan pelbagai watak dengan menganalisis hubungan dan interaksi yang diterangkan dalam input teks. Ia menggunakan algoritma canggih untuk memastikan kedudukan, pergerakan, dan interaksi yang realistik antara watak.