علي بابا تنافس في مجال الذكاء الاصطناعي بأداة مبتكرة

علي بابا تطور أداة مبتكرة لتوليد الفيديو باستخدام الذكاء الاصطناعي: تعرفوا على تورا

  • تاريخ النشر: الجمعة، 09 أغسطس 2024
علي بابا تنافس في مجال الذكاء الاصطناعي بأداة مبتكرة

تعمل مجموعة علي بابا الصينية على تطوير أداة ذكية جديدة لتوليد الفيديو تدعى تورا Tora، والتي تعتمد على إصدار مفتوح المصدر من نموذج سورا Sora، الذي طورته شركة OpenAI.

علي بابا تطور أداة مبتكرة لتوليد الفيديو باستخدام الذكاء الاصطناعي: تعرفوا على تورا

وبحسب ما ذكرته تقارير تقنية، فإن هذه الأداة الجديدة مصممة لإنشاء مقاطع الفيديو باستخدام أوامر نصية، مما يفتح آفاقاً جديدة في مجالات الذكاء الاصطناعي وتحليل الفيديوهات.

وقال باحثو شركة علي بابا إنهم اعتمدوا في تطوير تورا على نموذج مفتوح المصدر يعرف باسم OpenSora، والذي استخدم كقاعدة لتطوير هذه الأداة الذكية.

وتتيح تورا إنشاء فيديوهات موجهة النص، بحيث يمكن للمستخدمين كتابة نصوص توجيهية لتحريك العناصر داخل الفيديو.

وأشارت التقارير إلى أنه تم الإعلان عن هذه التقنية في ورقة بحثية نشرتها مجموعة من 5 باحثين يعملون في شركة علي بابا، حيث تناولوا فيها تفاصيل تطوير تورا، والإمكانيات التي توفرها.

وأوضحت أنه تم بناء تورا على بنية تعرف باسم Diffusion Transformer (DiT)، وهي بنية معمارية حديثة تدعم نموذج سورا.

وهذه البنية تمكن من إنشاء فيديوهات تأخذ بعين الاعتبار مسارات حركة العناصر في المقاطع، مثل حركة شخص يركب دراجة هوائية على مسار محدد، مع مراعاة جميع العوامل البيئية والفيزيائية التي قد تؤثر على هذه الحركة.

وأردفت الىقارير إن أداة تورا تبرز إمكانيات متقدمة في مجال توليد الفيديو، حيث تعتمد على تحليل دقيق لحركات العناصر، مما يتيح إنشاء مقاطع فيديو واقعية بشكل غير مسبوق.

ولفتت إلى أنه مع أن المشروع لا يزال في مراحله التطويرية، فإن الباحثين لم يحددوا بعد موعداً لإتاحة الأداة الذكية الجديدة للعامة.

جدير بالذكر أن تطوير أداة تورا يعتبر جزء من سلسلة جهود شركة علي بابا لتعزيز الابتكار في مجال توليد الفيديو، ومنافسة النماذج المماثلة التي طورتها شركات أخرى، بما في ذلك نموذج سورا الخاص بشركة OpenAI.

وتأتي هذه الخطوة بعد إعلان علي بابا في فبراير الماضي عن نموذج Emote Portrait Alive (EMO)، وهو نموذج ذكي يمكنه تحويل الصوت إلى فيديو، يظهر فيه الشخص وكأنه يتحدث أو يغني بصوته الحقيقي، دون الحاجة إلى استخدام نماذج ثلاثية الأبعاد معقدة للوجه.

القيادي الآن على واتس آب! تابعونا لكل أخبار الأعمال والرياضة