Follow ICT
شعار الموقع الاساسى
جايزة 160
جايزة 160

AudioPaLM.. نموذج ذكاء اصطناعي جديد من «جوجل» للكلام والترجمة

كشفت شركة جوجل، عن نموذج جديد للذكاء الاصطناعي اللغوي AudioPaLM، والذي يمكنه الاستماع والتحدث والترجمة بدقة عالية وسرعة كبيرة.

ويستطيع نموذج AudioPaLM  القيام بالعديد من الوظائف المختلفة مثل الترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نبرة الصوت نفسها، كما يمكنه التقاط الأصوات أو الأوامر المنطوقة، ثم إعادة إنتاج الصوت بلغات أخرى مختلفة.

ويعمل النموذج أيضًا على تعرّف الأصوات وترجمتها إلى نصوص، حتى إنه يمكنه ترجمة التراكيب اللغوية التي لم يتعرض لها من قبل بدقة كبيرة، وفقًا للباحثين العاملين على النموذج.

وبتتبع الاسم، نجد أن هذا النموذج الجديد يعتمد بالأساس على نقاط القوة في نموذجين آخرين موجودين بالفعل وهما PaLM-2 وAudioLM.

وينتمي نموذج PaLM-2 إلى نماذج اللغة الكبيرة LLMs التي تستطيع فهم ومحاكاة وتوليد النصوص بشكل يشبه اللغات البشرية، بينما يُعنى نموذج AudioLM بأشياء مثل الحفاظ على هوية المتحدث ونبرة الصوت (الصوتيات).

وقدم الباحثون في جوجل نموذج AudioPaLM عبر الجمع بين كلا النموذجين السابق الإشارة إليهما من أجل توليد النصوص والكلام بكفاءة عالية..

وحتى الآن لا يزال نموذج جوجل الجديد قيد البحث والتطوير، ولم تكشف حتى الآن عن موعد توفره للجمهور.