أعلنت شركة “مايكروسوفت”، عن نظام ذكي جديد أطلقت عليه “VALL-E”، بإمكانه تقليد صوت أي إنسان، وذلك من خلال تدريب النظام على مقطع بصوت الشخص المستهدف، لا تزيد مدته عن 3 ثوانٍ فقط.
والنظام الجديد لا يقتصر على إنشاء مقاطع صوتية عبر كتابة نصوص عشوائية، لكنه يستطيع أيضاً مراعاة أسلوب القراءة ونبرة الصوت، لإظهار شخصية صاحب الصوت الأصلي في المقاطع الصوتية المزيفة.
وبحسب موقع GitHub، لا يزال النظام قيد التطوير والبحث، لكن المشروع يقدم مستوى فائق في دقة محاكاة العوامل والمؤثرات الصوتية المحيطة بالمتحدث في المقطع الأصلي البالغة مدته 3 ثوان فقط، بحيث يتم إبرازها في المقاطع المصنعة بشكل أقرب للحقيقة.
وأوضحت عينات مقاطع صوتية عرضتها “مايكروسوفت” للكشف عن قدرات نظامها الجديد، مستوى دقيق للبرنامج في إنشاء مقاطع صوتية كأنها مسجلة خلال مكالمة هاتفية، وذلك من خلال اقتباس نمط الصوت ومستواه ودرجة شدته، من المقطع الأصلي المُسجل للمستخدم خلال حديثه في الحقيقة.
وأثبتت “مايكروسوفت” من خلال المقاطع الصوتية التي نشرتها على صفحة النظام الجديد على “جت هب” أن النظام بإمكانه إنشاء مقاطع صوتية بأساليب مختلفة، عبر استخدام صوت شخص واحد.