طرحت شركة “إنفيديا” نموذج جديد للذكاء الاصطناعي أطلقت عليه “Foundational Generative Audio Transformer Opus 1″، ويُعرف اختصارًا بـ”Fugatto“، يمكنه توليد الأصوات بناءً على الأوامر النصية.
ويتميز نموذج Fugatto بقدرته على إنشاء أصوات أو تعديل الموسيقى والصوتيات والملفات الصوتية بناءً على الأوامر النصية، بالتالي فهو مختلف عن تقنيات الذكاء الاصطناعي الأخرى التي أطلقتها شركات “رن واي” و”ميتا بلاتفورمز”.
على سبيل المثال، يمكن لنموذج Fugatto أخذ تسجيل صوتي منطوق وتغيير اللهجة المستخدمة والمزاج المعبر عنه.
وتستهدف صانعة الرقائق بهذا النموذج منتجي الأفلام وألعاب الفيديو.
وتم تدريب النموذج الجديد الذي تقدمه على بيانات مفتوحة المصدر، وقالت إنفيديا إنها لا تزال تناقش ما إذا كان سيتم إطلاقه علناً وكيفية إطلاقه.
وتعكس هذه التقنية تطورًا واسعًا في مجال إنشاء الصوتيات، حيث وقال برايان كاتانزارو، نائب رئيس قسم أبحاث التعلم التطبيقي في إنفيديا: “إذا نظرنا إلى الأصوات الاصطناعية على مدى الخمسين عامًا الماضية، نجد أن الموسيقى تبدو مختلفة الآن بسبب الحواسيب وأجهزة التوليف”.
وأكد أن الذكاء الاصطناعي التوليدي سيقدم قدرات جديدة للموسيقى وألعاب الفيديو وحتى للأفراد الذين يرغبون في إنشاء المحتوى، مما يتيح أدوات غير مسبوقة للتعبير الإبداعي.