أعلنت شركة ميتا، عن مجموعة من أدوات الذكاء الاصطناعي التوليدي التي تساعد في إنشاء المقاطع الصوتية والموسيقية استنادًا إلى الأوامر النصية، والتي أطلقت عليها AudioCraft.
وقالت ميتا في بيان عبر موقعها الرسمي، إن أدوات AudioCraft يمكنها أن تساعد الموسيقيين المحترفين في استكشاف تراكيب جديدة دون الحاجة إلى العزف على آلة موسيقية.
كما ستساعد مطوري الألعاب في إدخال تأثيرات صوتية واقعية وضوضاء محيطة في الألعاب، كما تفيد أصحاب الأعمال الصغيرة في إضافة تأثيرات صوتية إلى مقاطع الفيديو التي يشاركونها مع الجمهور.
بالتالي يمكن لصنّاع المحتوى استخدام الأدوات عبر إدخال أوصاف نصية بسيطة لإنشاء مقاطع صوتية معقدة، أو تأليف الألحان، أو حتى محاكاة فرق موسيقية افتراضية كاملة.
وأفادت شركة ميتا بأن مشروع AudioCraft يتكون من ثلاثة أجزاء رئيسية: AudioGen وهي أداة توليد التأثيرات والمشاهد الصوتية، و MusicGen وهي أداة توليد المؤلفات الموسيقية والألحان، وأداة فك الترميز EnCodec التي تساعد في توليد المخرجات الصوتية بجودة عالية وأقل قدر من الأخطاء والنشاز.
ونماذج الذكاء الاصطناعي الجديدة من ميتا مفتوحة المصدر ومتاحة للباحثين والمتخصصين لفهمها واستخدامها وتطويرها، مع إمكانية إنشاء نماذج مخصصة باستخدام البيانات الخاصة بهم.
وتسعى ميتا عبر أدواتها الجديدة إلى تسريع وتيرة تطوير الذكاء الاصطناعي في مجال الصوتيات الذي لا يزال متأخرًا مقارنةً بتقنيات الذكاء الاصطناعي التوليدي للنصوص والصور.
وسبقت شركات أخرى ميتا في إتاحة أدوات الذكاء الاصطناعي لتوليد الأصوات والموسيقى، ومنها شركة OpenAI التي أعلنت عن مشروع Jukebox عام 2020، وشركة جوجل التي أعلنت في وقتٍ سابق من العام الجاري عن مشروع MusicLM.