Follow ICT
شعار الموقع الاساسى
جايزة 160
جايزة 160

نموذج ذكاء اصطناعي جديد من «جوجل» يحول الصور لفيديو

كشفت شركة جوجل، عن نموذج “فلوجر” VLOGGER، وهو نموذج ذكاء اصطناعي جديد يتيح تحويل الصور الثابتة إلى مقاطع فيديو متحركة.

وقال باحثو جوجل، إن نموذج VLOGGER يمكنه من صور دة ثابتة واحدة توليد مقاطع فيديو واقعية لأشخاص يتحدثون ويتحركون ويظهرون التعبيرات الجسدية والإيماءات.

فيمكن لنموذج الذكاء الاصطناعي الجديد الاعتماد على مدخلات تتضمن صورة لشخص ما مع مقطع صوتي لإنتاج مقطع فيديو يُظهر الشخص وهو يتحدث بالصوت نفسه مع تعبيرات الوجه وإيماءات الرأس واليد الملائمة.

وتعتمد تلك التقنية على نماذج تعلم الآلة المتقدمة لإنتاج كثير من اللقطات الواقعية وتجميعها معًا في مقطع فيديو.

واعتمد الباحثون على نوع جديد من نماذج الذكاء الاصطناعي تُسمى نماذج الانتشار Diffusion Models، التي أظهرت أداءً مميزًا في توليد الصور من النصوص.

ووسع فريق الباحثين استخدامها ليشمل توليد مقاطع الفيديو مع التدريب على مجموعة ضخمة من البيانات، شملت ما يزيد على 800 ألف هوية مختلفة و 2200 ساعة من مقاطع الفيديو، مما أتاح لنموذج VLOGGER تعلم إنشاء مقاطع فيديو لأشخاص من أعراق وأعمار وملابس وأوضاع وبيئات متنوعة دون تحيز

ويمكن استخدام نموذج VLOGGER في العديد من الاستخدامات، ومنها دبلجة مقاطع الفيديو تلقائيًا عبر تبديل المسار الصوتي، وملء الإطارات المفقودة في مقاطع الفيديو، وإنشاء صور رمزية واقعية للألعاب والواقع الافتراضي، وإنشاء ربوتوتات دردشة يمكنها التفاعل مع المستخدمين على نحو أفضل.

ويمثل نموذج VLOGGER طفرة كبيرة في تحريك الصور الثابتة، إلا أن احتمالية إساءة استخدام النموذج ما تزال قائمة.