طرحت شركة “ميتا” نموذج ذكاء اصطناعي جديد معني بتقليد الأصوات البشرية، الأمر الذي يعد خطوة متقدمة في تطوير الروبوتات الذكية القادرة على التواصل الصوتي بنحو أكثر تعقيدًا وواقعية.
ونموذج ميتا الجديد “Spirit LM” يهدف إلى تقديم تجربة صوتية طبيعية وأكثر تعبيرًا، ويستند إلى نموذج لغوي مُدرّب سابقًا يحتوي على 7 مليارات مَعلمة، ويتميز بقدرته على معالجة الصوت بنحو مختلف عن النماذج التقليدية التي تعتمد على تقنيات تعرّف الكلام تلقائيًا (ASR).
ويعتمد “Spirit LM” على استخدام رموز الفونيم (الوحدات الصوتية) والنغمات ودرجات الصوت، مما يمكّنه من إنتاج أصوات طبيعية، والتعلم من مهام جديدة تشمل تعرّف الكلام، وتحويل النص إلى صوت، وتصنيف الكلام.
وكشفت ميتا عن هذا النموذج في ورقة بحثية، وهو يتوفر الآن كمشروع مفتوح المصدر للمطورين والباحثين لاستخدامه وتطويره.
ويُتوقع أن يُستخدم نموذج “Spirit LM” مستقبلًا ضمن تطبيقات ميتا مثل واتساب وإنستجرام وفيسبوك، مما يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي عبر محادثات صوتية طبيعية مليئة بالتعبيرات على غرار الوضع الصوتي المتقدم الذي قدمته شركة OpenAI مؤخرًا.