أطلق معهد النماذج التأسيسية في جامعة محمد بن زايد للذكاء الاصطناعي خمسة نماذج لغوية جديدة، وهو ما يمثل محطة مفصلية في مسيرة المعهد والباحثين في الجامعة.
وبهذا ينجح المعهد بعد عام من إنشائه، أن يفتح آفاقًا جديدة في مجال أدوات الذكاء الاصطناعي التوليدي، وأن يتيح لكبار العلماء والمهندسين والمتخصصين في مجال الذكاء الاصطناعي فرصة تطوير نماذج واسعة النطاق.
ويحرص الباحثون في المعهد على تطوير نماذج لغوية متخصصة ومتعددة الوسائط تعتبر الأولى من نوعها في العالم، لدرجة أن جامعة محمد بن زايد للذكاء الاصطناعي حصدت شهرة عالمية نظرًا إلى خبرتها في هذا المجال.
وتستخدم نماذج (بايميدكس) BiMediX، و(بالو) PALO، و(جلام إم) GLaMM، و(جيوتشات) GeoChat، و(موبايل لاما) MobiLLaMA، التعلّم المتعدد الوسائط لمعالجة البيانات وتحليلها من وسائط أو مصادر متعددة تتخطى حدود النصوص لتشمل المقاطع الصوتية والصور، مع التركيز بنحو خاص في قدرات هذه النماذج في اللغة العربية.
وصمم الباحثون النماذج الخمسة لإحداث تأثير إيجابي في مجال الرعاية الصحية، والاستدلال البصري التفصيلي، والقدرات المتعددة الوسائط المتعددة اللغات، والاستدلال المتعدد الوسائط للمجال الجغرافي المكاني، والنماذج اللغوية الكبيرة الفعّالة في الأجهزة المحمولة.
وطوّر المركز هذه النماذج بناءً على أبحاث مكثفة أجراها أعضاء الهيئة التدريسية والباحثون والطلاب في الجامعة.
النماذج الخمسة
يُعدّ نموذج (بايميدكس) BiMediX؛ أول نموذج لغوي كبير ثنائي اللغة في العالم مخصص للقطاع الطبي يتفوق على العديد من الأنظمة المُستخدمة باللغتين الإنجليزية والعربية، بما يشمل: اختبارات المجالس الطبية.
أما نموذج (جلام إم) GLaMM، فهو أول نموذج كبير متعدد الوسائط قادر على توليد استجابات لغوية طبيعية ترتبط بالأجسام التي تَرِد في الصور على مستوى البكسل، إذ يُعدّ أفضل وأكثر تفصيلًا من الشرح الآلي للصور والاستدلال والقدرة على تبديل الأجسام في الصور.
وينموذج (بالو) PALO، أول نموذج كبير متعدد الوسائط في العالم يشمل قدرات الاستدلال البصري بعشر لغات رئيسية، تشمل: الإنجليزية والصينية والهندية والإسبانية والفرنسية والعربية والبنغالية والروسية والأوردو واليابانية.
ويضمن هذا النموذج مستوى عاليًا من الدقة على الصعيد اللغوي، حتى عند استخدام اللغات المحدودة الموارد، مثل: الأوردو أو البنغالية، ليتيح بذلك لثلثي سكان العالم الاستفادة منه.
أما نموذج (جيوتشات) GeoChat، فهو أول نموذج لغوي كبير للاستدلال المتعدد الوسائط للمجال الجغرافي المكاني على مستوى العالم، إذ صُمم خصوصًا لحالات الاستشعار من بُعد. فعلى عكس النماذج العامة، يتميّز هذا النموذج بالتعامل مع الصور العالية الدقة التي تُلتقط عبر الاستشعار من بُعد.
وتعليقًا على ذلك؛ قال البروفيسور تيموثي بالدوين؛ عميد الجامعة بالإنابة، والأستاذ في مجال معالجة اللغة الطبيعية: “تُبرز هذه النماذج قدرة معهد النماذج التأسيسية على تحويل الأبحاث المتطورة إلى تطبيقات تتيح استخدام هذه التقنيات في المجتمع بطرق جديدة.
ويأتي هذا النهج في إطار رؤية الجامعة التي تقوم على التميّز في توليد المعرفة ونقلها ونشر الذكاء الاصطناعي لتعزيز النمو الاقتصادي، وترسيخ مكانة أبوظبي كمركز عالمي للذكاء الاصطناعي.