Wan 2.1 & WanX 2.1 & Wan AI

ما هو Wan 2.1 من Wan AI؟

Wan AI هو نموذج متقدم وقوي لتوليد المرئيات تم تطويره بواسطة معمل Tongyi. يمكنه توليد مقاطع فيديو بناءً على النص والصور وإشارات التحكم الأخرى. نماذج سلسلة Wan 2.1 متاحة الآن كمصدر مفتوح بالكامل.استكشف الأمثلة

نظرة عامة على Wan AI

👍

أداء متفوق

يتفوق Wan 2.1 باستمرار على نماذج المصدر المفتوح الحالية والحلول التجارية المتطورة عبر معايير متعددة.

🚀

يدعم وحدات معالجة الرسومات للمستهلكين

يتطلب نموذج T2V-1.3B 8.19 جيجابايت فقط من ذاكرة الفيديو، مما يجعله متوافقًا مع جميع وحدات معالجة الرسومات للمستهلكين تقريبًا. يمكنه إنشاء فيديو 480P مدته 5 ثوانٍ على RTX 4090 في حوالي 4 دقائق (بدون تقنيات التحسين مثل التكميم). أداؤه قابل للمقارنة حتى مع بعض النماذج مغلقة المصدر.

🎉

مهام متعددة

يتفوق Wan 2.1 في تحويل النص إلى فيديو، والصور إلى فيديو، وتحرير الفيديو، والنص إلى صور، والفيديو إلى صوت، مما يدفع مجال توليد الفيديو إلى الأمام.

🔮

توليد النص المرئي

Wan 2.1 هو أول نموذج فيديو قادر على توليد النص باللغتين الصينية والإنجليزية، ويتميز بتوليد نص قوي يعزز تطبيقاته العملية.

💪

محرك الفيديو VAE القوي من Wan AI

يقدم Wan-VAE كفاءة وأداء استثنائيين، حيث يقوم بترميز وفك ترميز مقاطع فيديو 1080P بأي طول مع الحفاظ على المعلومات الزمنية، مما يجعله أساسًا مثاليًا لتوليد الفيديو والصور.

ميزات Wan AI

حركات معقدة بواسطة Wan AI

يتفوق في توليد مقاطع فيديو واقعية تتميز بحركات جسم واسعة، ودوران معقد، وانتقالات مشهد ديناميكية، وحركات كاميرا سلسة.

المحاكاة الفيزيائية بواسطة Wan AI

ينتج مقاطع فيديو تحاكي بدقة الفيزياء في العالم الحقيقي والتفاعلات الواقعية للأجسام.

جودة سينمائية بواسطة Wan AI

يقدم مرئيات تشبه الأفلام مع نسيج غني ومجموعة متنوعة من التأثيرات المنمقة.

تحرير قابل للتحكم بواسطة Wan AI

يتميز بنموذج تحرير عالمي للتعديلات الدقيقة باستخدام مراجع الصور أو الفيديو.

توليد النص المرئي بواسطة Wan AI

ينشئ نصوصًا وتأثيرات نصية ديناميكية في مقاطع الفيديو مباشرة من موجهات النص.

سباق 8 بت

موجه: رسوم متحركة بأسلوب 8 بت قديم لمقدمة سباق سيارات. سيارات عضلية مكونة من وحدات البكسل، كل منها بألوان وتصاميم مميزة، تصطف عند خط البداية في مشهد صحراوي واسع مكون من وحدات البكسل. يومض نص كبير مكون من وحدات البكسل 'WANX RACING' فوق السيارات بألوان نيون نابضة بالحياة، يذكر بعناوين ألعاب الأركيد الكلاسيكية. تتحرك الكاميرا عبر المشهد، مسلطة الضوء على الجمالية القديمة والنص. تتميز الخلفية بمشهد صحراوي بسيط مكون من وحدات البكسل مع غروب شمس مكعب يلقي ظلالًا ذهبية دافئة على المشهد. البيئة بأكملها مغمورة بألوان نيون نابضة بالحياة مكونة من وحدات البكسل، مما يعزز الشعور بالحنين.

عيد ميلاد سعيد

موجه: مشهد حفلة عيد الميلاد واقعي ومزين بشكل جميل، أشجار عيد الميلاد مزينة بأضواء ملونة وهدايا، لهب يرقص في المدفأة، وأشخاص من خبز الزنجبيل يرتدون قبعات عيد الميلاد يرقصون حول الشجرة، وطاولات مليئة بالديك الرومي المشوي وأطايب أخرى. تظهر تأثيرات نصية رائعة على الشاشة: 'عيد ميلاد سعيد!' الشاشة رائعة ومتطورة وموجزة.

سباق مجنون

موجه: تسلسل عنوان بأسلوب السبعينيات القديم لفيلم حركة خيالي. يظهر نص 'WANX' مرسوم باليد ومنمق بشكل ديناميكي على الشاشة، متراكبًا على لقطات سريعة من مطاردات السيارات والانفجارات والحركات الجريئة. النص جريء وخشن ومشوه قليلاً، يعكس جمالية أفلام الحركة في السبعينيات. مونتاج من المشاهد عالية الطاقة مع تأثير حبيبات الفيلم القديم، يتميز بألوان دافئة قديمة. المشاهد مغمورة بضوء الساعة الذهبية، مما يعزز الشعور بالحنين.

المؤثرات الصوتية والموسيقى بواسطة Wan AI

يولد مؤثرات صوتية وموسيقى خلفية تتناسق تمامًا مع المحتوى المرئي والإيقاع.

قنادس تدخل الماء

موجه: تتحرك الكاميرا بسرعة من البعيد إلى القريب، بزاوية رؤية منخفضة، واقفة على جذع شجرة. في المنظر البعيد، يظهر قندس أبيض فجأة، يلعب مع الجذع ويقفز في الماء، ثم يسبح خارج الماء ويخرج رأسه. في هذه اللحظة، تقترب الكاميرا لتظهر لقطة قريبة للقندس الأبيض. عدة أشجار توت بجانبه مرشوشة بالماء، والطحالب والثلج يغطيان الأرض، وسطح الماء مغطى بأوراق خضراء متساقطة. الخلفية هي شجر البتولا الأبيض.

حفل Wan AI

موجه: مجموعة من الناس تؤدي سيمفونية في قاعة فيينا.

سقوط الجليد

موجه: مجموعة من الناس تؤدي سيمفونية في قاعة فيينا.

ميزات المنتج

من خلال منتجنا، يمكنك الاستفادة بسلاسة من نماذجنا مع تجربة سهلة الاستخدام للوصول إلى محتوى فيديو ملهم.

المصدر المفتوح لـ Wan AI

في هذا المستودع، نقدم الكود والأوزان لـ Wan 2.1، وهي مجموعة شاملة ومفتوحة من نماذج الفيديو الأساسية المصممة لدفع حدود توليد الفيديو.

Wan2.1-I2V-14B

يتفوق نموذج I2V-14B على النماذج الرائدة مغلقة المصدر وكذلك جميع نماذج المصدر المفتوح الحالية، محققاً أداءً متفوقاً. وهو قادر على توليد مقاطع فيديو تظهر مشاهد بصرية معقدة وأنماط حركة بناءً على النص والصور المدخلة، بما في ذلك نماذج بدقة 480P و720P.

Wan2.1-T2V-14B

😊480-720P

يضع نموذج T2V-14B معياراً جديداً للأداء المتفوق بين نماذج المصدر المفتوح والمغلق، مظهراً قدرته على توليد صور عالية الجودة مع ديناميكيات حركة كبيرة. وهو أيضاً النموذج الوحيد القادر على إنتاج نصوص باللغتين الصينية والإنجليزية ويدعم توليد الفيديو بدقة 480P و720P.

Wan2.1-T2V-1.3B

😊480P

يدعم نموذج T2V-1.3B توليد الفيديو على جميع وحدات معالجة الرسومات للمستهلكين تقريباً، حيث يتطلب فقط 8.19 جيجابايت من ذاكرة BRAM لإنتاج فيديو 480P مدته 5 ثوانٍ، مع وقت إخراج 4 دقائق فقط على وحدة معالجة الرسومات RTX 4090. من خلال عمليات التدريب المسبق والتقطير، يتفوق على نماذج المصدر المفتوح الأكبر ويحقق أداءً مماثلاً لبعض النماذج المتقدمة مغلقة المصدر.

Wan2.1-FLF2V-14B-720P

وان 2.1 للإطار الأول والأخير إلى فيديو (FLF2V) هي تقنية توليد فيديو تعتمد على الذكاء الاصطناعي تقوم بتوليف الإطارات الوسيطة بين إطار البداية والنهاية المحددين لإنتاج مقاطع فيديو سلسة. تستخدم نموذجًا بمعلمات 14B، وتدعم الاستدلال المُسرع متعدد وحدات معالجة الرسومات، وتوفر نقاط تفتيش مدربة مسبقًا مع عرض توضيحي Gradio للاختبار التفاعلي. تشمل التطبيقات ملء الفيديو، وإنتاج الرسوم المتحركة، والمزيد.

التقرير التقني

ترقبوا الإصدار القادم من تقريرنا التقني الشامل للمزيد من التفاصيل.

بُني على نموذج محول الانتشار السائد، يحقق Wan 2.1 تقدمًا كبيرًا في قدرات التوليد من خلال سلسلة من الابتكارات، بما في ذلك المشفر التلقائي المتغير المكاني-الزمني (VAE) الجديد، واستراتيجيات التدريب المسبق القابلة للتطوير، وبناء البيانات واسع النطاق، ومقاييس التقييم الآلي. تعزز هذه المساهمات مجتمعة أداء النموذج وتنوعه.

لماذا تختار Wan AI؟

اختبر مستقبل إنشاء الفيديو بالذكاء الاصطناعي مع تقنية رائدة في الصناعة وقدرات لا مثيل لها.

جودة عالية للغاية

إنشاء مقاطع فيديو بجودة سينمائية مع تفاصيل واقعية ومحاكاة فيزيائية دقيقة.

تحكم متقدم في الحركة

التعامل السلس مع الحركات المعقدة والدوران وديناميكيات الجسم الطبيعية.

دعم اللغات العالمية

إنشاء مقاطع فيديو مع تأثيرات نصية متعددة اللغات للجمهور العالمي.

معالجة سريعة كالبرق

مدعوم بـ 3D causal VAE من الجيل التالي لإنشاء فيديو 1080P غير محدود.

التميز بأسعار معقولة

إنتاج فيديو احترافي بجزء بسيط من التكاليف التقليدية.

الأسئلة الشائعة

1

ما هو Wan 2.1 من Wan AI وكيف يعمل؟

Wan 2.1 من Wan AI هو نموذج توليد فيديو متطور من Alibaba Cloud يحول الأوصاف النصية إلى مقاطع فيديو مذهلة عالية الجودة. باستخدام تقنيات متقدمة مثل المشفرات التلقائية المتغيرة (VAE) ومحولات الانتشار (DiT)، يضمن صورًا واقعية وانتقالات سلسة وفيزياء دقيقة لتجربة غامرة حقًا.

2

هل أحتاج إلى خبرة تقنية لاستخدام Wan 2.1 من Wan AI؟

تم تصميم Wan 2.1 من Wan AI مع مراعاة البساطة. تتيح واجهته البديهية لأي شخص إنشاء مقاطع فيديو احترافية الجودة بسهولة، حتى بدون مهارات تقنية متقدمة. سواء كنت مبتدئًا أو محترفًا، ستجد المنصة سهلة التنقل والاستخدام.

3

ما أنواع مقاطع الفيديو التي يمكنني إنشاؤها باستخدام Wan 2.1 من Wan AI؟

Wan 2.1 من Wan AI متعدد الاستخدامات وقادر على توليد مجموعة واسعة من محتوى الفيديو. من المشاهد الديناميكية مثل الرقص والرياضة إلى البرامج التعليمية وترميم الفيديو التاريخي، يمكنك من تحقيق رؤيتك الإبداعية.

4

كم من الوقت يستغرق توليد فيديو؟

يعتمد وقت توليد الفيديو على تعقيد ومدة مشروعك. للحصول على نتائج أسرع، يوفر الإصدار المحترف سرعات معالجة معززة، مما يجعله مثاليًا للمهام الحساسة للوقت.

5

هل يمكنني تخصيص مخرجات الفيديو؟

بالتأكيد! يوفر Wan 2.1 من Wan AI خيارات تخصيص واسعة، تتيح لك ضبط الدقة ومعدل الإطارات وتعقيد الحركة والمزيد. قم بتخصيص مقاطع الفيديو الخاصة بك لتلبية احتياجاتك وتفضيلاتك المحددة.

6

ما تنسيقات الإدخال التي يدعمها Wan 2.1 من Wan AI لتوليد الفيديو؟

يدعم Wan 2.1 من Wan AI بشكل أساسي الأوصاف النصية كمدخلات لتوليد الفيديو. يمكنك تقديم موجهات نصية مفصلة تصف المشهد والإجراءات والتأثيرات المرئية المطلوبة. بالإضافة إلى ذلك، قد يدعم مدخلات الصور لتعزيز السياق في التحديثات المستقبلية.

7

هل يمكن لـ Wan 2.1 من Wan AI توليد مقاطع فيديو بلغات متعددة؟

نعم، يدعم Wan 2.1 من Wan AI مدخلات نصية متعددة اللغات، مما يتيح لك توليد مقاطع فيديو بناءً على أوصاف بلغات مختلفة. ومع ذلك، قد تختلف جودة المخرجات حسب اللغة وتعقيد الوصف.

8

هل هناك حد لطول مقاطع الفيديو التي يمكن لـ Wan 2.1 من Wan AI توليدها؟

يعتمد طول مقاطع الفيديو المولدة على خطة الاشتراك. قد يكون للإصدار المجاني قيود على مدة الفيديو، بينما يدعم الإصدار المحترف توليد فيديو أطول وأكثر تعقيدًا. يمكن العثور على الحدود المحددة في وثائق المنصة.

9

كيف يضمن Wan 2.1 من Wan AI جودة مقاطع الفيديو المولدة؟

يستفيد Wan 2.1 من Wan AI من تقنيات متقدمة مثل المشفرات التلقائية المتغيرة (VAE) ومحولات الانتشار (DiT) لضمان مخرجات عالية الجودة. تمكن هذه التقنيات من الصور الواقعية والانتقالات السلسة ومحاكاة الفيزياء الدقيقة.

10

كيف يتعامل Wan 2.1 من Wan AI مع المشاهد المعقدة مع شخصيات متعددة؟

تم تصميم Wan 2.1 من Wan AI للتعامل مع المشاهد المعقدة مع شخصيات متعددة من خلال تحليل العلاقات والتفاعلات الموصوفة في النص المدخل. يستخدم خوارزميات متقدمة لضمان الوضع الواقعي والحركات والتفاعلات بين الشخصيات.