أعلنت مجموعة “علي بابا” الصينية، عن انضمام العالم الصيني البارز “لي شيانجانج” إلى صفوفها، لتولي قيادة فريق الذكاء الاصطناعي الصوتي في الشركة، في خطوة تعكس طموحات الشركة المتزايدة في قطاع الذكاء الاصطناعي
ويعد “لي” من الأسماء اللامعة في مجال تقنيات التعرف على الكلام، فهو يحمل شهادة الدكتوراة في علوم الحاسوب والمعلومات من جامعة بكين، وتولى رسمياً قيادة فريق البحث الصوتي في “علي بابا”، خلفاً للباحث السابق يان تشيجي.
ويعمل فريق الكلام ضمن مختبر “تونجي” التابع لشركة علي بابا، والذي يُركّز على تطوير نماذج الكلام واللغة متعددة الوسائط.
وفي يوليو 2024، أطلق المختبر اثنين من أبرز نماذجه مفتوحة المصدر: SenseVoice وCosyVoice.
ووفقاً للشركة، تفوق نموذج SenseVoice في التعرف على الكلام متعدد اللغات بنسبة 50% مقارنة بنموذج Whisper الشهير من “OpenAI”، تحديداً في اللغتين الصينية والكانتونية.
وتسعى “علي بابا” من خلال استقطاب “لي” لتعزيز موقعها في سوق الذكاء الاصطناعي، وخاصة في التطبيقات المعتمدة على النماذج الصوتية، مثل روبوتات المحادثة الرقمية والصور الرمزية، وهو مجال يشهد منافسة محتدمة بين عمالقة التقنية في الصين، مثل “بايدو”، التي استعرضت مؤخراً صورة رمزية رقمية للمتحدث الصيني الشهير لو يونجهاو خلال فعالية خاصة بالذكاء الاصطناعي.
ويمتلك “لي” مسيرة مهنية حافلة، تنقّل خلالها بين شركات تقنية رائدة مثل “بايدو”، حيث قاد تطوير نظام DeepSpeaker للتعرف على المتحدثين، و”ديدي” التي تولّى فيها تطوير خدمات التفاعل الصوتي داخل المركبات وخدمة العملاء الذكية.
كما شغل لي لاحقاً منصب نائب رئيس قسم التكنولوجيا في شركة 01.AI الناشئة، والتي شارك في تأسيسها عام 2023 لتطوير نماذج لغوية كبيرة (LLMs)، قبل أن يغادرها إثر تغيير في استراتيجيتها التقنية.
وبحسب بيانات “ستاتيستا”، يُتوقع أن تصل قيمة سوق تقنيات التعرف على الكلام في الصين إلى نحو 11.97 مليار يوان (1.66 مليار دولار) بحلول عام 2025، مع معدل نمو سنوي يُقدّر بـ 17.95% ليصل إلى 31.95 مليار يوان بحلول عام 2031.