أطلقت شركة “إنفيديا” نموذج ذكاء اصطناعي جديد أطلقت عليه اسم LATTE3D، وهو يتيح توليد الأشكال الثلاثية الأبعاد.
وخلال ثواني، يقوم نموذج LATTE3D بتحويل المطالبات النصية إلى تمثيلات واقعية ثلاثية الأبعاد للأشياء والحيوانات.
ويعد النموذج بمثابة تقدم كبير، فكانت النماذج المتقدمة لتحويل النص إلى أشكال ثلاثية الأبعاد قبل عام واحد تستغرق ساعة كاملة لتوليد صور بالجودة نفسها.
والآن يمكن للنماذج فعل الشيء نفسه في غضون 12 ثانية فقط، مما يجعل تحويل النص إلى أشكال ثلاثية الأبعاد في الوقت الفعلي في متناول المبدعين عبر الصناعات.
ووفقًا لـ”إنفيديا”، فإن النموذج الجديد يمكنه إنتاج أشكال ثلاثية الأبعاد مفصلة بصورة فورية تقريبًا عند تشغيله عبر وحدة معالجة رسومات واحدة، مثل Nvidia RTX A6000.
ويوفر النموذج الأشكال المولدة بتنسيق شائع قابل للاستخدام في التطبيقات القياسية لنمذجة الرسومات، مما يعني أنه يمكن إضافتها داخل البيئات الافتراضية.
وقال باحثو إنفيديا، إن نتائج النموذج الجديد تتوافق مع العديد من المجالات، مثل ألعاب الفيديو، والحملات الإعلانية، ومشاريع التصميم، وساحات التدريب الافتراضية للروبوتات، وعوالم الواقع الافتراضي.
ويغير نموذج LATTE3D قواعد اللعبة للمصممين، إذ أصبح بإمكانهم استخدام النموذج لتوليد أفكار متعددة للأشكال فورًا بدلًا من إضاعة الوقت في البحث في مكتبة الأصول الثلاثية الأبعاد الواسعة.
ويولد النموذج مجموعة صغيرة من الأشكال الثلاثية الأبعاد لكل رسالة نصية، مما يعني أن المصمم لديه خيارات متعددة للاختيار من بينها.
كما يمكنه بعد ذلك تحسين الشكل الذي اختاره وتحسين جودة رسوماته في غضون دقائق قليلة باستخدام المطالبات النصية.
وبمجرد أن يشعر المصمم بالرضا عن النتائج، يمكنه بعد ذلك تصديره إلى تطبيق برمجي رسومي، مثل Omniverse من إنفيديا، وهي منصة تدعم إطار العمل USD لتبادل بيانات الرسومات الثلاثية الأبعاد.
ودربت إنفيديا LATTE3D على قاعدتي بيانات محددتين تحتويان أشكال الحيوانات والأشياء اليومية، مع أنه يمكن للباحثين تدريب النموذج على أنواع أخرى من البيانات، مثل المباني أو المركبات، من أجل توسيع وظائفه.
واستخدمت إنفيديا وحدات معالجة الرسوميات القديمة A100 Tensor Core لتدريب النموذج، كما استخدمت ChatGPT من OpenAI لتعليم النموذج فهم مجموعة متنوعة من المطالبات النصية، مما يحسن قدرته في فهم العبارات المختلفة التي قد يستخدمها شخص ما لوصف كائن ثلاثي الأبعاد.