Wan 2.1 & WanX 2.1 & Wan AI
Apa itu Wan 2.1 oleh Wan AI?
Wan AI adalah model generasi visual canggih dan kuat yang dikembangkan oleh Lab Tongyi. Ini dapat menghasilkan video berdasarkan teks, gambar, dan sinyal kontrol lainnya. Model seri Wan 2.1 sekarang sepenuhnya open-source.Eksplorasi contoh
Ikhtisar Wan AI
Performa SOTA
Wan 2.1 secara konsisten mengungguli model open-source yang ada dan solusi komersial mutakhir di berbagai benchmark.
Mendukung GPU Kelas Konsumen
Model T2V-1.3B hanya membutuhkan 8.19 GB VRAM, membuatnya kompatibel dengan hampir semua GPU kelas konsumen. Ini dapat menghasilkan video 480P 5 detik pada RTX 4090 dalam waktu sekitar 4 menit (tanpa teknik optimasi seperti kuantisasi). Kinerjanya bahkan sebanding dengan beberapa model closed-source.
Beberapa tugas
Wan 2.1 unggul dalam Teks-ke-Video, Gambar-ke-Video, Pengeditan Video, Teks-ke-Gambar, dan Video-ke-Audio, memajukan bidang generasi video.
Generasi Teks Visual
Wan 2.1 adalah model video pertama yang mampu menghasilkan teks bahasa Mandarin dan Inggris, menampilkan generasi teks yang kuat yang meningkatkan aplikasi praktisnya.
Video VAE Wan AI yang Kuat
Wan-VAE memberikan efisiensi dan kinerja luar biasa, mengkodekan dan mendekodekan video 1080P dengan panjang apa pun sambil mempertahankan informasi temporal, menjadikannya fondasi ideal untuk generasi video dan gambar.
Fitur Wan AI
Gerakan Kompleks oleh Wan AI
Unggul dalam menghasilkan video realistis yang menampilkan gerakan tubuh ekstensif, rotasi kompleks, transisi adegan dinamis, dan gerakan kamera yang lancar.
Simulasi Fisika oleh Wan AI
Menghasilkan video yang secara akurat mensimulasikan fisika dunia nyata dan interaksi objek yang realistis.
Kualitas Sinematik oleh Wan AI
Menawarkan visual seperti film dengan tekstur kaya dan berbagai efek bergaya.
Pengeditan Terkontrol oleh Wan AI
Menampilkan model pengeditan universal untuk pengeditan presisi menggunakan referensi gambar atau video.
Generasi Teks Visual oleh Wan AI
Membuat teks dan efek teks dinamis dalam video langsung dari prompt teks.
Balapan 8-Bit
Prompt: Animasi gaya retro 8-bit dari intro balapan mobil. Mobil muscle berpiksel, masing-masing dengan warna dan desain yang berbeda, berbaris di garis start di lanskap gurun berpiksel yang luas. Teks berpiksel besar "WANX RACING" berkedip di atas mobil dalam warna neon yang cerah, mengingatkan pada judul game arcade klasik. Kamera menyapu adegan, menyoroti estetika retro dan teks. Latar belakang menampilkan lanskap gurun berpiksel sederhana dengan matahari terbenam berbentuk blok yang memancarkan nuansa keemasan hangat ke seluruh adegan. Seluruh lingkungan dimandikan dalam warna neon berpiksel yang cerah, meningkatkan nuansa nostalgia.
Selamat Natal
Prompt: Adegan pesta Natal yang realistis dan dihias indah, pohon Natal dihiasi dengan lampu warna-warni dan hadiah, api menari di perapian, orang-orang jahe mengenakan topi Natal menari mengelilingi pohon, dan meja-meja dipenuhi dengan kalkun panggang dan hidangan lezat lainnya. Efek teks yang indah muncul di layar: "Selamat Natal!" Layar terlihat indah, canggih, dan ringkas.
Balapan Gila
Prompt: Urutan judul bergaya retro 70-an untuk film aksi fiksi. Teks "WANX" yang digambar tangan dan bergaya muncul secara dinamis di layar, ditumpangkan pada klip pengejaran mobil, ledakan, dan aksi berbahaya yang cepat. Teksnya tebal, kasar, dan sedikit terdistorsi, mencerminkan estetika film aksi 70-an. Montase adegan beroktan tinggi dengan efek grain film retro, menampilkan warna vintage yang hangat. Urutannya dimandikan cahaya golden hour, meningkatkan nuansa nostalgia.
Efek Suara & Musik oleh Wan AI
Menghasilkan efek suara dan musik latar yang selaras sempurna dengan konten visual dan ritme.
Ferret Masuk Air
Prompt: Kamera bergerak cepat dari jauh ke dekat, dengan sudut pandang rendah, berdiri di atas sebatang kayu. Dalam pandangan jauh, seekor ferret putih tiba-tiba muncul, bermain dengan kayu dan melompat ke dalam air, kemudian berenang keluar dari air dan mengeluarkan kepalanya. Pada saat ini, kamera memperbesar untuk menunjukkan close-up ferret putih. Beberapa pohon berry di sebelahnya terpercik air, lumut dan salju menutupi tanah, dan permukaan air ditutupi oleh daun hijau yang jatuh. Latar belakangnya adalah pohon birch putih.
Konser Wan AI
Prompt: Sekelompok orang sedang memainkan simfoni di Aula Vienna.
Es Jatuh
Prompt: Sekelompok orang sedang memainkan simfoni di Aula Vienna.
Fitur Produk
Melalui produk kami, Anda dapat memanfaatkan model kami dengan pengalaman yang ramah pengguna untuk mengakses konten video yang menginspirasi.
Wan AI Open Source
Dalam repo ini, kami merilis kode dan bobot untuk Wan 2.1, suite komprehensif dan terbuka dari model fondasi video yang dirancang untuk mendorong batas generasi video.
Model I2V-14B mengungguli model closed-source terkemuka serta semua model open-source yang ada, mencapai kinerja SOTA. Ini mampu menghasilkan video yang menunjukkan adegan visual kompleks dan pola gerakan berdasarkan teks dan gambar input, termasuk model resolusi 480P dan 720P.
Wan2.1-T2V-14B
😊480-720PModel T2V-14B menetapkan kinerja SOTA baru di antara model open-source dan closed-source, menunjukkan kemampuannya untuk menghasilkan visual berkualitas tinggi dengan dinamika gerakan yang substansial. Ini juga merupakan satu-satunya model video yang mampu menghasilkan teks bahasa Mandarin dan Inggris dan mendukung generasi video pada resolusi 480P dan 720P.
Wan2.1-T2V-1.3B
😊480PModel T2V-1.3B mendukung generasi video di hampir semua GPU kelas konsumen, hanya membutuhkan 8.19 GB BRAM untuk menghasilkan video 480P 5-detik, dengan waktu output hanya 4 menit pada GPU RTX 4090. Melalui proses pra-pelatihan dan distilasi, model ini melampaui model open-source yang lebih besar dan mencapai kinerja yang setara dengan beberapa model closed-source yang canggih.
Wan2.1-FLF2V-14B-720P
Wan 2.1 First-Last-Frame-to-Video (FLF2V) adalah teknologi pembuatan video berbasis AI yang mensintesis frame-frame antara frame awal dan akhir yang diberikan untuk menghasilkan video yang mulus. Teknologi ini menggunakan model 14B-parameter, mendukung inferensi yang dipercepat multi-GPU, dan menyediakan checkpoint yang telah dilatih sebelumnya dengan demo Gradio untuk pengujian interaktif. Aplikasinya mencakup inpainting video, produksi animasi, dan lainnya.
Laporan Teknis
Tunggu rilis mendatang dari laporan teknis komprehensif kami untuk detail lebih lanjut.
Dibangun di atas paradigma Diffusion Transformer arus utama, Wan 2.1 mencapai kemajuan signifikan dalam kemampuan generatif melalui beberapa inovasi termasuk Variational Autoencoder (VAE) spatio-temporal baru kami, strategi pra-pelatihan yang dapat diskalakan, pembuatan data skala besar, dan metrik evaluasi otomatis. Kontribusi ini secara kolektif meningkatkan kinerja dan keserbagunaan model.
Mengapa Memilih Wan AI?
Rasakan masa depan generasi video AI dengan teknologi terdepan di industri dan kemampuan yang tak tertandingi.
Output Kualitas Ultra-Tinggi
Hasilkan video berkualitas sinematik dengan detail seperti asli dan simulasi fisika yang akurat.
Kontrol Gerakan Canggih
Menangani gerakan kompleks, rotasi, dan dinamika tubuh alami dengan mulus.
Dukungan Bahasa Global
Buat video dengan efek teks multibahasa untuk penonton di seluruh dunia.
Pemrosesan Super Cepat
Didukung oleh 3D causal VAE generasi berikutnya untuk generasi video 1080P tanpa batas.
Keunggulan Terjangkau
Produksi video kelas profesional dengan biaya jauh lebih rendah dari biaya tradisional.
Pertanyaan yang Sering Diajukan
Apa itu Wan 2.1 oleh Wan AI dan bagaimana cara kerjanya?
Wan 2.1 oleh Wan AI adalah model generasi video mutakhir Alibaba Cloud yang mengubah deskripsi teks menjadi video berkualitas tinggi yang menakjubkan. Memanfaatkan teknologi canggih seperti Variational Autoencoders (VAE) dan Diffusion Transformers (DiT), ini memastikan visual yang realistis, transisi yang mulus, dan fisika yang akurat untuk pengalaman yang benar-benar mendalam.
Apakah saya memerlukan keahlian teknis untuk menggunakan Wan 2.1 oleh Wan AI?
Wan 2.1 oleh Wan AI dirancang dengan kesederhanaan. Antarmukanya yang intuitif memungkinkan siapa saja untuk membuat video berkualitas profesional dengan mudah, bahkan tanpa keterampilan teknis tingkat lanjut. Baik Anda pemula atau pro, Anda akan menemukan platform ini mudah dinavigasi dan digunakan.
Jenis video apa yang bisa saya buat dengan Wan 2.1 oleh Wan AI?
Wan 2.1 oleh Wan AI serbaguna dan mampu menghasilkan berbagai konten video. Dari adegan dinamis seperti menari dan olahraga hingga tutorial pendidikan dan restorasi video sejarah, ini memberdayakan Anda untuk mewujudkan visi kreatif Anda.
Berapa lama waktu yang diperlukan untuk menghasilkan video?
Waktu generasi video tergantung pada kompleksitas dan panjang proyek Anda. Untuk hasil yang lebih cepat, versi Pro menawarkan kecepatan pemrosesan yang dipercepat, membuatnya ideal untuk tugas yang sensitif terhadap waktu.
Bisakah saya menyesuaikan output video?
Tentu saja! Wan 2.1 oleh Wan AI menyediakan opsi kustomisasi yang luas, memungkinkan Anda menyesuaikan resolusi, frame rate, kompleksitas gerakan, dan lainnya. Sesuaikan video Anda untuk memenuhi kebutuhan dan preferensi spesifik Anda.
Format input apa yang didukung Wan 2.1 oleh Wan AI untuk generasi video?
Wan 2.1 oleh Wan AI terutama mendukung deskripsi teks sebagai input untuk generasi video. Anda dapat memberikan prompt teks terperinci yang menggambarkan adegan, tindakan, dan efek visual yang diinginkan. Selain itu, mungkin mendukung input gambar untuk konteks yang ditingkatkan dalam pembaruan mendatang.
Bisakah Wan 2.1 oleh Wan AI menghasilkan video dalam berbagai bahasa?
Ya, Wan 2.1 oleh Wan AI mendukung input teks multibahasa, memungkinkan Anda menghasilkan video berdasarkan deskripsi dalam berbagai bahasa. Namun, kualitas output mungkin bervariasi tergantung pada bahasa dan kompleksitas deskripsi.
Apakah ada batasan panjang video yang dapat dihasilkan Wan 2.1 oleh Wan AI?
Panjang video yang dihasilkan tergantung pada paket berlangganan. Versi gratis mungkin memiliki batasan durasi video, sementara versi Pro mendukung generasi video yang lebih panjang dan kompleks. Batasan spesifik dapat ditemukan dalam dokumentasi platform.
Bagaimana Wan 2.1 oleh Wan AI memastikan kualitas video yang dihasilkan?
Wan 2.1 oleh Wan AI memanfaatkan teknologi canggih seperti Variational Autoencoders (VAE) dan Diffusion Transformers (DiT) untuk memastikan output berkualitas tinggi. Teknologi ini memungkinkan visual yang realistis, transisi yang mulus, dan simulasi fisika yang akurat.
Bagaimana Wan 2.1 oleh Wan AI menangani adegan kompleks dengan banyak karakter?
Wan 2.1 oleh Wan AI dirancang untuk menangani adegan kompleks dengan banyak karakter dengan menganalisis hubungan dan interaksi yang dijelaskan dalam input teks. Ini menggunakan algoritma canggih untuk memastikan posisi, gerakan, dan interaksi yang realistis antar karakter.