Nvidia تطلق نموذج ذكاء اصطناعي لتوليد الأصوات من النصوص
نموذج Fugatto: ثورة جديدة في تقنيات الذكاء الاصطناعي الصوتي من شركة Nvidia
أعلنت شركة Nvidia عن تطوير نموذج ذكاء اصطناعي جديد يحمل اسم Fugatto، مخصص لتوليد الأصوات بناء على بيانات نصية يحددها المستخدم.
نموذج Fugatto: ثورة جديدة في تقنيات الذكاء الاصطناعي الصوتي من شركة Nvidia
ووفقاً لما ذكرته تقارير تقنية، فإن اسم النموذج الجديد الكامل هو Foundational Generative Audio Transformer Opus، حيث يتيح إنشاء أصوات متنوعة وذات جودة عالية، وذلك باستخدام النصوص المكتوبة كمرجع.
وأشارت إلى أن هذا النموذج يمتاز بقدرات متعددة في مجال توليد الأصوات وتحليلها، لافتة إلى أن هذه القدرات تجعله أداة واعدة في العديد من المجالات الإبداعية.
وأوضحت التقارير أنه على سبيل المثال، يمكن لـ Fugatto توليد مقطوعات موسيقية مستوحاة من كلمات أغنية معينة، أو تعديل الموسيقى عن طريق إزالة أصوات محددة، كما يمكنه إنشاء أصوات تحاكي الآلات الموسيقية بطريقة مبتكرة.
ونقلت تصريحات منسوبة إلى مسؤول في شركة Nvidia، الذي قال إن نموذج Fugatto يمثل خطوتها الأولى نحو تطوير ذكاء اصطناعي قادر على توليد الأصوات، وفهمها بطريقة تحاكي البشر.
وتابع قائلاً إن هذا النموذج يدعم مهام متعددة تتعلق بتوليد الصوت وتحويله، لافتة إلى أن هذا يجعل الشركة أقرب إلى تطوير أنظمة ذكاء اصطناعي أكثر تطوراً في هذا المجال.
وأفادت التقارير أن النموذج الجديد لا يقتصر على المجالات الموسيقية فحسب، بل سيكون له تأثير كبير في العديد من الصناعات الأخرى.
وبينت أنه من أبرز هذه الصناعات، مجال تطوير ألعاب الفيديو، موضحة أنه يمكن للمطورين استخدام Fugatto لإضافة مؤثرات صوتية مبتكرة وشخصية لكل مشهد في اللعبة.
وأردفت التقارير إنه بالإضافة إلى ذلك، يمكن لمصممي الفيديوهات الاستفادة من إمكانيات هذا النموذج، لتخصيص الأصوات بما يناسب مشاريعهم الإبداعية.
وأضافت أنه مع هذا الابتكار الجديد، تعزز Nvidia مكانتها في مقدمة الشركات التي تطور تقنيات الذكاء الاصطناعي، مما يفتح آفاقاً جديدة لتطبيقات الصوت المدعومة بالتكنولوجيا الحديثة، ويعد بثورة حقيقية في عالم إنتاج الموسيقى والتصميم الصوتي.