Wan 2.1 & WanX 2.1 & Wan AI
Wan 2.1 nedir?
Wan AI, Tongyi Lab tarafından geliştirilen gelişmiş ve güçlü bir görsel oluşturma modelidir. Metin, resim ve diğer kontrol sinyallerine dayalı videolar oluşturabilir. Wan 2.1 serisi modelleri artık tamamen açık kaynaklıdır.Örnekleri keşfedin
Wan AI Genel Bakış
SOTA Performans
Wan 2.1, mevcut açık kaynaklı modelleri ve ticari çözümleri çeşitli benchmarklarda sürekli olarak geride bırakır.
Tüketici Sınıfı GPU'ları Destekler
T2V-1.3B modeli yalnızca 8.19 GB VRAM gerektirir, bu da onu neredeyse tüm tüketici sınıfı GPU'larla uyumlu hale getirir. RTX 4090'da yaklaşık 4 dakika içinde 480P çözünürlükte 5 saniyelik bir video oluşturabilir (quantization gibi optimizasyon teknikleri olmadan). Performansı bazı kapalı kaynaklı modellerle bile karşılaştırılabilir.
Çoklu Görevler
Wan 2.1, Metinden Video, Resimden Video, Video Düzenleme, Metinden Resim ve Videodan Sese olanak sağlayarak video oluşturma alanında ilerler.
Görsel Metin Oluşturma
Wan 2.1, hem Çince hem de İngilizce metin üretebilen ilk video modelidir ve güçlü metin üretimi sayesinde pratik uygulamalarını artırır.
Wan AI'ın Güçlü Video VAE'si
Wan-VAE, 1080P çözünürlükte herhangi bir uzunluktaki videoları zaman bilgisini koruyarak kodlayıp kod çözmeye olanak sağlar, bu da video ve resim oluşturma için mükemmel bir temel oluşturur.
Wan AI Özellikleri
Karmaşık Hareketler
Geniş vücut hareketleri, karmaşık dönüşler, dinamik sahne geçişleri ve akıcı kamera hareketleri içeren gerçekçi videolar oluşturmada üstünlük sağlar.
Fiziksel Simülasyon
Gerçek dünya fiziğini ve gerçekçi nesne etkileşimlerini doğru bir şekilde simüle eden videolar oluşturur.
Sinematik Kalite
Zengin dokular ve çeşitli stilize edilmiş efektlerle film görüntüleri sunar.
Kontrollü Düzenleme
Resim veya video referansları kullanarak hassas düzenlemeler yapmak için evrensel bir düzenleme modeli sunar.
Görsel Metin Oluşturma
Metin ipuçlarından doğrudan videolara metin ve dinamik metin efektleri oluşturur.
8-Bit Yarış
İpuçları: Retro 8-bit tarzında bir araba yarışı giriş animasyonu. Farklı renklerde ve tasarımlarda kaslı muscle car'lar, geniş, pikselli bir çöl manzarasında bir başlangıç çizgisinde dizilir. Ekranın üstünde neon renklerde parlak 'WANX RACING' yazısı yanıp söner. Kamera, retro estetiği ve metni vurgulayarak sahneyi tarar. Arkaplanda basit, pikselli bir çöl manzarası ve bloklu bir günbatımı, sahneye altın sarısı sıcak ışıklar saçar. Tüm ortam, nostaljik hissi artıran parlak, pikselli neon renklerle kaplıdır.
Mutlu Noeller
İpuçları: Gerçekçi, güzel süslenmiş bir Noel partisi sahnesi, renkli ışıklarla ve hediyelerle bezenmiş Noel ağaçları, şöminede dans eden alevler, şapkalı zencefillerin Noel ağacı etrafında dans ettiği ve masalarda ızgara tavuk ve diğer lezzetlerle dolu. Ekranda 'Mutlu Noeller!' yazısı zarif, sofistike ve özlü bir şekilde belirir.
Çılgın Yarış
İpuçları: Hayali bir aksiyon filminin 70'ler tarzı başlık dizisi. Hızlı kesimlerde araba kovalamacaları, patlamalar ve cesur kaskaderlik sahneleri üzerine el yazısı tarzında dinamik 'WANX' yazısı belirir. Metin kalın, kaba ve hafif bozulmuş, 70'ler aksiyon filmi estetiğini yansıtır. Montaj, altın saat ışığında retro film taneli efektle hızlı tempoda sahneler içerir. Sahneler, nostaljik hissi artıran sıcak, vintage renklerle kaplıdır.
Ses Efektleri & Müzik
Görsel içeriğin ritmiyle mükemmel bir şekilde uyumlu ses efektleri ve arka plan müziği oluşturur.
Ferretler Suya Giren
İpuçları: Kameranın uzaktan yakına hızlı hareket ettiği, alçak bir açıdan bakış açısıyla bir kütük üzerinde duran bir sahne. Uzak görünümde, bir anda ortaya çıkan beyaz bir ferret, kütükle oynar ve suya atlar, sonra sudan çıkar ve başını suyun üstüne çıkarır. Bu sırada kamera, beyaz ferretin yakın çekimini gösterir. Birkaç yanındaki berry ağacı suya sıçrar, yer yosunu ve kar sahneyi kaplar, su yüzeyi yeşil döküntülerle kaplıdır. Arkaplanda beyaz huş ağaçları vardır.
Wan AI Konseri
İpuçları: Bir grup insan Viyana Salonu'nda bir senfoni icra ediyor.
Buz Düşüşü
İpuçları: Bir grup insan Viyana Salonu'nda bir senfoni icra ediyor.
Ürün Özellikleri
Ürünümüz sayesinde modellerimizi kullanıcı dostu bir deneyimle sorunsuz bir şekilde kullanabilir ve ilham verici video içeriğine erişebilirsiniz.
Wan AI Açık Kaynak
Bu depoda, Wan2.1 için kodları ve ağırlıkları yayınlıyoruz, video temel modellerinin kapsamlı ve açık bir seti, video oluşturma sınırlarını zorlamak için tasarlanmıştır.
I2V-14B modeli, hem kapalı kaynaklı modelleri hem de tüm mevcut açık kaynaklı modelleri geride bırakarak SOTA performansına ulaşır. Metin ve resim girdilerine dayalı karmaşık görsel sahneleri ve hareket desenlerini gösteren videolar oluşturabilir, hem 480P hem de 720P çözünürlükte modelleri içerir.
Wan2.1-T2V-14B
😊480-720PT2V-14B modeli, hem açık kaynaklı hem de kapalı kaynaklı modeller arasında yeni bir SOTA performansı belirler ve önemli görsel dinamiklerle yüksek kaliteli görüntüler oluşturma yeteneğini sergiler. Ayrıca, hem Çince hem de İngilizce metin üretebilen ve 480P ve 720P çözünürlükte video oluşturma yeteneğine sahip tek video modelidir.
Wan2.1-T2V-1.3B
😊480PT2V-1.3B modeli, neredeyse tüm tüketici sınıfı GPU'larda video oluşturmayı destekler ve 5 saniyelik 480P bir video oluşturmak için yalnızca 8.19 GB BRAM gerektirir, RTX 4090 GPU'da çıktı süresi sadece 4 dakikadır. Ön eğitim ve damıtma süreçleriyle, daha büyük açık kaynaklı modelleri geride bırakır ve bazı gelişmiş kapalı kaynaklı modellerle bile karşılaştırılabilir performansa ulaşır.
Wan2.1-FLF2V-14B-720P
Wan 2.1 First-Last-Frame-to-Video (FLF2V), akıcı videolar üretmek için verilen başlangıç ve bitiş kareleri arasındaki ara kareleri sentezleyen AI tabanlı bir video üretim teknolojisidir. 14B parametreli bir model kullanır, çoklu GPU hızlandırmalı çıkarımı destekler ve etkileşimli testler için Gradio demosu ile önceden eğitilmiş kontrol noktaları sunar. Uygulamalar video inpainting, animasyon üretimi ve daha fazlasını içerir.
Teknik Rapor
Daha fazla ayrıntı için yakında yayınlanacak kapsamlı teknik raporumuzu bekleyin.
Ana akım dağıtım dönüşümü paradigması üzerine inşa edilen Wan 2.1, yenilikçi bir dizi geliştirmeyle üretkenlikte önemli ilerlemeler kaydeder. Bunlar arasında yeni bir uzaysal-zamansal değişken otomatik kodlayıcı (VAE), ölçeklenebilir ön eğitim stratejileri, büyük ölçekli veri yapımı ve otomatik değerlendirme metrikleri yer alır. Bu katkılar, modelin performansını ve esnekliğini birlikte artırır.
Neden Wan AI?
Endüstri lideri teknoloji ve eşsiz yeteneklerle AI video üretiminin geleceğini deneyimleyin.
Ultra Yüksek Kaliteli Çıktı
Gerçekçi detaylar ve hassas fizik simülasyonu ile sinematik kalitede videolar oluşturun.
Gelişmiş Hareket Kontrolü
Karmaşık hareketleri, dönüşleri ve doğal vücut dinamiklerini sorunsuz şekilde işleyin.
Küresel Dil Desteği
Dünya çapındaki izleyiciler için çok dilli metin efektleriyle videolar oluşturun.
Yıldırım Hızında İşleme
Sınırsız 1080P video üretimi için yeni nesil 3D nedensel VAE ile güçlendirilmiştir.
Uygun Fiyatlı Mükemmellik
Geleneksel maliyetlerin çok küçük bir kısmına profesyonel düzeyde video üretimi.
Sıkça Sorulan Sorular
Wan 2.1 nedir ve nasıl çalışır?
Wan 2.1, Alibaba Cloud'un en gelişmiş video oluşturma modelidir ve metin açıklamalarını muhteşem, yüksek kaliteli videolara dönüştürür. Değişken Otomatik Kodlayıcılar (VAE) ve Dağıtım Dönüşümleri (DiT) gibi gelişmiş teknolojileri kullanarak gerçekçi görüntüler, pürüzsüz geçişler ve doğru fizik sağlar.
Wan 2.1'i kullanmak için teknik bilgi gerekiyor mu?
Wan 2.1, basitliği ön planda tutar. Kullanıcı dostu arayüzü sayesinde herkes, gelişmiş teknik becerilere sahip olmadan profesyonel kalitede videolar oluşturabilir. Başlangıç seviyesinden profesyonel seviyeye kadar herkes için kolay kullanımlıdır.
Wan 2.1 ile hangi tür videolar oluşturabilirim?
Wan 2.1, dans ve spor gibi dinamik sahnelerden eğitim öğreticilerine ve tarihi video restorasyonuna kadar geniş bir yelpazede video içeriği oluşturma yeteneğine sahiptir. Yaratıcı vizyonunuzu hayata geçirmek için size güç verir.
Bir video oluşturmak ne kadar sürer?
Video oluşturma süresi, projenizin karmaşıklığına ve uzunluğuna bağlıdır. Zaman kritik görevler için Pro sürümü, işlem hızını hızlandırarak daha hızlı sonuçlar sunar.
Video çıktısını özelleştirebilir miyim?
Kesinlikle! Wan 2.1, çözünürlük, kare hızı, hareket karmaşıklığı ve daha fazlasını ayarlamanıza olanak tanıyan geniş özelleştirme seçenekleri sunar. İhtiyaçlarınıza ve tercihlerinize uygun videolar oluşturun.
Wan 2.1, video oluşturma için hangi giriş formatlarını destekler?
Wan 2.1, video oluşturma için öncelikle metin açıklamalarını destekler. Sahne, eylemler ve istenen görsel efektleri ayrıntılı olarak açıklayan metinsel ipuçları sağlayabilirsiniz. Gelecekteki güncellemelerde resim girdilerini de destekleyebilir.
Wan 2.1, çok dilli metin girdilerini destekliyor mu?
Evet, Wan 2.1, çeşitli dillerdeki metin girdilerini destekler, bu sayede bu dillerdeki açıklamalara dayalı videolar oluşturabilirsiniz. Ancak, çıktı kalitesi dil ve açıklamanın karmaşıklığına bağlı olarak değişebilir.
Wan 2.1'in oluşturabileceği videoların uzunluğunda bir sınır var mı?
Video uzunluğu, abonelik planınıza bağlıdır. Ücretsiz sürümde video süresi sınırlı olabilirken, Pro sürümü daha uzun ve karmaşık video oluşturmayı destekler. Ayrıntılar için platformun dokümantasyonuna bakın.
Wan 2.1, oluşturulan videoların kalitesini nasıl sağlar?
Wan 2.1, Değişken Otomatik Kodlayıcılar (VAE) ve Dağıtım Dönüşümleri (DiT) gibi gelişmiş teknolojileri kullanarak yüksek kaliteli çıktıları garanti eder. Bu teknolojiler, gerçekçi görüntüler, pürüzsüz geçişler ve doğru fizik simülasyonları sağlar.
Wan 2.1, çoklu karakterli karmaşık sahneleri nasıl işler?
Wan 2.1, metin girdisinde açıklanan ilişkileri ve etkileşimleri analiz ederek çoklu karakterli karmaşık sahneleri işler. Karakterlerin gerçekçi konumlandırılması, hareketleri ve etkileşimleri için gelişmiş algoritmalar kullanır.