Wan 2.1 & WanX 2.1 & Wan AI
Co to jest Wan 2.1 od Wan AI?
Wan AI to zaawansowany i potężny model generowania wizualnego opracowany przez Tongyi Lab. Może generować filmy na podstawie tekstu, obrazów i innych sygnałów kontrolnych. Modele z serii Wan 2.1 są teraz całkowicie otwarte.Eksploruj przykłady
Przegląd Wan AI
Wydajność SOTA
Wan 2.1 konsekwentnie przewyższa istniejące modele open-source i rozwiązania komercyjne w wielu benchmarkach.
Obsługa GPU Konsumenckich
Model T2V-1.3B wymaga tylko 8.19 GB VRAM, co czyni go kompatybilnym z prawie wszystkimi konsumenckimi GPU. Może wygenerować 5-sekundowe wideo 480P na RTX 4090 w około 4 minuty (bez technik optymalizacyjnych takich jak kwantyzacja). Jego wydajność jest nawet porównywalna z niektórymi modelami closed-source.
Wiele Zadań
Wan 2.1 wyróżnia się w generowaniu wideo z tekstu, obrazów, edycji wideo, tekst-obraz i wideo-audio, rozwijając dziedzinę generowania wideo.
Generowanie Tekstu Wizualnego
Wan 2.1 jest pierwszym modelem wideo zdolnym do generowania zarówno tekstu chińskiego, jak i angielskiego, z solidną generacją tekstu, która poprawia jego praktyczne zastosowania.
Potężny VAE Wideo od Wan AI
Wan-VAE oferuje wyjątkową wydajność i efektywność, kodując i dekodując wideo 1080P o dowolnej długości, zachowując informacje czasowe, co czyni go idealną podstawą do generowania wideo i obrazów.
Funkcje Wan AI
Złożone Ruchy
Wyróżnia się w generowaniu realistycznych filmów z rozległymi ruchami ciała, złożonymi obrotami, dynamicznymi zmianami scen i płynnymi ruchami kamery.
Symulacja Fizyczna
Generuje filmy, które dokładnie symulują realną fizykę i interakcje obiektów.
Jakość Filmowa
Oferuje wizualne efekty filmowe z bogatymi teksturami i różnorodnymi stylizowanymi efektami.
Kontrolowana Edycja przez Wan AI
Zawiera uniwersalny model edycji do precyzyjnych poprawek z wykorzystaniem odniesień obrazów lub wideo.
Generowanie Tekstu Wizualnego przez Wan AI
Tworzy tekst i dynamiczne efekty tekstowe w filmach bezpośrednio z podpowiedzi tekstowych.
Wyścig 8-Bitowy
Podpowiedź: Retro animacja w stylu 8-bitowym wprowadzenia do wyścigu samochodowego. Pikselowe muscle cars, każdy z innym kolorem i designem, ustawiają się na linii startowej na rozległym pikselowym pustynnym krajobrazie. Wielki pikselowy tekst „WANX RACING” migocze nad samochodami w jaskrawych neonowych kolorach, przypominając tytuły klasycznych gier arcade. Kamera przesuwa się po scenie, podkreślając retro estetykę i tekst. Tło przedstawia prosty pikselowy pustynny krajobraz z zachodem słońca w blokach, rzucającym ciepłe złote odcienie na scenę. Całe otoczenie jest zanurzone w jaskrawych pikselowych neonowych kolorach, które wzmacniają nostalgiczne uczucie.
Wesołych Świąt
Podpowiedź: Realistyczna, pięknie udekorowana scena świątecznej imprezy, choinki ozdobione kolorowymi światełkami i prezentami, płomienie tańczące w kominku, pierniczki z piernikiem w kapeluszach świątecznych tańczące wokół choinki, a stoły pełne pieczonego indyka i innych przysmaków. Wykwintne efekty tekstowe pojawiają się na ekranie: „Wesołych Świąt!”. Ekran jest wykwintny, elegancki i zwięzły.
Szalony Wyścig
Podpowiedź: Retro sekwencja tytułowa do fikcyjnego filmu akcji z lat 70. Ręcznie rysowany, stylizowany tekst „WANX” pojawia się dynamicznie na ekranie, nakładając się na szybkie klipy pościgów samochodowych, eksplozji i śmiałych kaskaderów. Tekst jest śmiały, szorstki i lekko zniekształcony, odzwierciedlając estetykę filmów akcji z lat 70. Montaż szybkich scen z efektem ziarnistości filmu retro, z ciepłymi, wintage'owymi kolorami. Sceny są zanurzone w złotym świetle zmierzchu, co wzmacnia nostalgiczne uczucie.
Efekty Dźwiękowe i Muzyka
Generuje efekty dźwiękowe i muzykę tła, które idealnie współgrają z treścią wizualną i rytmem.
Fretki Wchodzą do Wody
Podpowiedź: Kamera szybko przesuwa się z daleka na blisko, z niskim kątem widzenia, stojąc na kłodzie. W oddali nagle pojawia się biały fretek, bawi się z kłodą i skacze do wody, a następnie wypływa z wody i wyciąga głowę. W tym momencie kamera przybliża, aby pokazać zbliżenie białego fretka. Kilka drzew jagodowych w pobliżu jest skropione wodą, mech i śnieg pokrywają ziemię, a powierzchnia wody jest pokryta opadłymi zielonymi liśćmi. Tło stanowi biała brzoza.
Koncert Wan AI
Podpowiedź: Grupa ludzi wykonuje symfonię w sali wiedeńskiej.
Spadający Lód
Podpowiedź: Grupa ludzi wykonuje symfonię w sali wiedeńskiej.
Funkcje Produktu
Dzięki naszemu produktowi możesz bezproblemowo korzystać z naszych modeli, oferując prostą w użyciu obsługę, aby uzyskać dostęp do inspirujących treści wideo.
Wan AI Open Source
W tym repozytorium udostępniamy kod i wagi dla Wan2.1, kompleksowego i otwartego zestawu podstawowych modeli wideo zaprojektowanych do przesuwania granic generowania wideo.
Model I2V-14B przewyższa wiodące modele closed-source oraz wszystkie istniejące modele open-source, osiągając wydajność SOTA. Jest w stanie generować filmy, które demonstrują złożone sceny wizualne i wzorce ruchów na podstawie tekstu i obrazów wejściowych, w tym modeli 480P i 720P.
Wan2.1-T2V-14B
😊480-720PModel T2V-14B ustanawia nowy standard SOTA zarówno wśród modeli open-source, jak i closed-source, demonstrując swoją zdolność do generowania wysokiej jakości wizualnej z istotną dynamiką ruchu. Jest to również jedyny model wideo zdolny do produkowania zarówno tekstu chińskiego, jak i angielskiego, a także wspiera generowanie wideo w rozdzielczości 480P i 720P.
Wan2.1-T2V-1.3B
😊480PModel T2V-1.3B wspiera generowanie wideo na prawie wszystkich konsumenckich GPU, wymagając tylko 8.19 GB BRAM, aby wyprodukować 5-sekundowe wideo 480P, z czasem wyjścia zaledwie 4 minuty na GPU RTX 4090. Dzięki procesom pre-treningowym i destylacji przewyższa większe modele open-source i osiąga wydajność porównywalną z niektórymi zaawansowanymi modelami closed-source.
Wan2.1-FLF2V-14B-720P
Wan 2.1 First-Last-Frame-to-Video (FLF2V) to technologia generowania wideo oparta na AI, która syntezuje klatki pośrednie między podaną klatką początkową a końcową, aby tworzyć płynne filmy. Wykorzystuje model o 14B parametrów, wspiera przyspieszone wnioskowanie na wielu GPU i oferuje wstępnie wytrenowane punkty kontrolne z demo Gradio do testów interaktywnych. Zastosowania obejmują wypełnianie wideo, produkcję animacji i więcej.
Raport Techniczny
Zostań z nami, aby poznać szczegóły w naszym nadchodzącym kompleksowym raporcie technicznym.
Oparty na głównym paradygmacie transformatorów dyfuzyjnych, Wan 2.1 osiąga znaczące postępy w zdolnościach generowania dzięki serii innowacji, w tym naszego nowatorskiego spatiotemporalnego autoenkodera wariacyjnego (VAE), skalowalnych strategii pre-treningowych, budowy danych w dużej skali i automatycznych metryk oceny. Te wkłady zbiorowo poprawiają wydajność i wszechstronność modelu.
Dlaczego Wan AI?
Doświadcz przyszłości generowania wideo AI z wiodącą w branży technologią i niezrównanymi możliwościami.
Ultra Wysoka Jakość
Generuj filmy o jakości kinowej z realistycznymi detalami i dokładną symulacją fizyczną.
Zaawansowana Kontrola Ruchu
Płynna obsługa złożonych ruchów, obrotów i naturalnej dynamiki ciała.
Globalne Wsparcie Językowe
Twórz filmy z wielojęzycznymi efektami tekstowymi dla odbiorców na całym świecie.
Błyskawiczne Przetwarzanie
Napędzane przez przyczynowy VAE 3D nowej generacji do nieograniczonego generowania wideo 1080P.
Przystępna Doskonałość
Profesjonalna produkcja wideo za ułamek tradycyjnych kosztów.
Często Zadawane Pytania
Co to jest Wan 2.1 od Wan AI i jak to działa?
Wan 2.1 od Wan AI to najnowocześniejszy model generowania wideo firmy Alibaba Cloud, który przekształca opisy tekstowe w zachwycające, wysokiej jakości filmy. Dzięki zaawansowanym technologiom, takim jak autoenkodery wariacyjne (VAE) i transformatory dyfuzyjne (DiT), zapewnia realistyczne wizualizacje, płynne przejścia i dokładną fizykę dla prawdziwie immersyjnego doświadczenia.
Czy potrzebuję wiedzy technicznej, aby używać Wan 2.1 od Wan AI?
Wan 2.1 od Wan AI został zaprojektowany z myślą o prostocie użytkowania. Jego intuicyjny interfejs pozwala każdemu bez wysiłku tworzyć profesjonalne filmy, nawet bez zaawansowanych umiejętności technicznych. Niezależnie od tego, czy jesteś początkującym, czy profesjonalistą, znajdziesz platformę łatwą w nawigacji i użyciu.
Jakie rodzaje filmów mogę stworzyć z Wan 2.1 od Wan AI?
Wan 2.1 od Wan AI jest wszechstronny i zdolny do generowania szerokiej gamy treści wideo. Od dynamicznych scen, takich jak taniec i sport, po materiały edukacyjne i restauracje historycznych filmów, pozwala Ci ożywić swoją wizję kreatywną.
Jak długo trwa generowanie filmu?
Czas generowania filmu zależy od złożoności i długości Twojego projektu. Dla szybszych wyników wersja Pro oferuje przyspieszone prędkości przetwarzania, idealne dla zadań wrażliwych na czas.
Czy mogę dostosować wyjście wideo?
Oczywiście! Wan 2.1 od Wan AI oferuje szerokie możliwości dostosowania, pozwalając Ci regulować rozdzielczość, liczbę klatek na sekundę, złożoność ruchu i wiele innych parametrów. Dostosuj swoje filmy do swoich specyficznych potrzeb i preferencji.
Jakie formaty wejściowe obsługuje Wan 2.1 od Wan AI do generowania wideo?
Wan 2.1 od Wan AI obsługuje głównie opisy tekstowe jako wejście do generowania wideo. Możesz dostarczyć szczegółowe podpowiedzi tekstowe opisujące scenę, akcje i pożądane efekty wizualne. Ponadto może wspierać wejścia obrazowe dla większego kontekstu w przyszłych aktualizacjach.
Czy Wan 2.1 od Wan AI może generować filmy w wielu językach?
Tak, Wan 2.1 od Wan AI obsługuje wielojęzyczne wprowadzanie tekstu, pozwalając Ci generować filmy na podstawie opisów w różnych językach. Jednak jakość wyjścia może się różnić w zależności od języka i złożoności opisu.
Czy istnieje limit długości filmów, które Wan 2.1 od Wan AI może generować?
Długość generowanych filmów zależy od planu subskrypcji. Wersja darmowa może mieć ograniczenia dotyczące długości wideo, podczas gdy wersja Pro obsługuje dłuższe i bardziej złożone generacje wideo. Szczegółowe limity można znaleźć w dokumentacji platformy.
Jak Wan 2.1 od Wan AI zapewnia jakość generowanych filmów?
Wan 2.1 od Wan AI wykorzystuje zaawansowane technologie, takie jak autoenkodery wariacyjne (VAE) i transformatory dyfuzyjne (DiT), aby zapewnić wysoką jakość wyjścia. Te technologie umożliwiają realistyczne wizualizacje, płynne przejścia i dokładne symulacje fizyczne.
Jak Wan 2.1 od Wan AI radzi sobie ze scenami z wieloma postaciami?
Wan 2.1 od Wan AI został zaprojektowany do obsługi złożonych scen z wieloma postaciami poprzez analizowanie relacji i interakcji opisanych w tekście wejściowym. Wykorzystuje zaawansowane algorytmy, aby zapewnić realistyczne pozycjonowanie, ruchy i interakcje między postaciami.