أعلنت شركة ميتا عن نماذج ذكاء اصطناعي جديدة مفتوح المصدر، قادرة على التعرّف على أكثر من 4000 لغة منطوقة حول العالم، بزيادة قدرها بأربعين ضعفًا مقارنةً بالتقنيات المتوفرة سابقًا.
وتدعي ميتا على تلك النماذج التي أطلقت عليها “نماذج الكلام الضخمة المتعددة اللغات” Massively Multilingual Speech واختصارًا (MMS)، أنها قادرة على تحويل النص إلى كلام والعكس بأكثر من 1100 لغة، بزيادة عشرة أضعاف على ما كان موجودًا.
وعن الهدف من وراء تطوير تلك النماذج، قالت ميتا، إن أحد أهدافها هو الحفاظ على اللغات من خطر الانقراض، مضيفة: تتعرض العديد من لغات العالم لخطر الاختفاء، ولن تؤدي القيود المفروضة على تقنية تعرّف الكلام وتوليده حاليًا إلا إلى تسريع هذا الاتجاه.
وجعلت ميتا نماذجها الجديدة مفتوحة المصدر، حتى يتمكن الباحثون من الوصول إليها والمساهمة في تطويرها، من أجل المساعدة في الحفاظ على لغات العالم.
وهناك العديد من المجالات التي قد تُستخدم فيها تقنيات الكلام المستندة إلى الذكاء الاصطناعي وفقًا لشركة ميتا، مثل خدمات المراسلة وتقنيات الواقع الافتراضي والواقع المعزز، إذ ستفهم كل الأصوات، وتخدم المستخدم بلغته المفضلة.
وتتطلب نماذج تعرّف الكلام وتحويل النص إلى كلام تدريبًا على آلاف الساعات من التسجيلات الصوتية مع النصوص المفرّغة المصاحبة لها، وهذا أمر ضروري للغاية، حتى تفهم الخوارزمياتُ النصوصَ وتصنفها بشكل صحيح.
وواجهت ميتا صعوبات في جمع تسجيلات صوتية للّغات غير المستخدمة على نطاق واسع، إذ إن البيانات المتوفرة حاليًا تغطي فقط اللغات المئة الأكثر انتشارًا حول العالم.
ولجأت ميتا إلى استخدام طرق غير تقليدية من أجل التغلب على تلك الصعوبات، حيث قامت بجمع التسجيلات الصوتية للنصوص الدينية المترجمة إلى مختلف اللغات، وأرفقت تلك التسجيلات مع الترجمات المعتمدة، الأمر الذي سمح لميتا بالحصول على 32 ساعة من البيانات في المتوسط للغات الأقل انتشارًا، وزيادة إجمالي اللغات في النماذج إلى أكثر من 4000 لغة.