كشفت اختبارات معهد أمن الذكاء الاصطناعي في المملكة المتحدة أن نموذج GPT-5.5 من شركة -أوبن إيه آي” يضاهي قدرات الأمن السيبراني لنموذج “ميثوس” من “أنثروبيك”، الذي حظي بترويج واسع النطاق كنموذج رائد في مجال الأمن السيبراني.
وفي تقييم حديث أجراه المعهد حقق نموذج GPT-5.5 الجديد من “أوبن إيه آي”مستوى أداء مماثلًا في التقييمات السيبرانية لنموذج “ميثوس”، الذي قيمه المعهد الشهر الماضي.
وفي فئة المهام عالية التعقيد التي تُعرف باسم “Expert”، نجح GPT-5.5 في اجتياز متوسط بلغ 71.4% من التحديات، مقارنةً بـ 68.6% لنموذج “ميثوس”، وهو فارق يقع ضمن هامش الخطأ الإحصائي.
وفي أحد التحديات المعقدة، الذي تضمن بناء أداة لفك شيفرة ملف بلغة “Rust”، تمكن GPT-5.5 من حل المهمة خلال 10 دقائق و22 ثانية دون أي تدخل بشري، وبتكلفة تشغيلية منخفضة.
كما أظهر النموذجان تقدمًا ملحوظًا في اختبار “The Last Ones”، وهو بيئة محاكاة لهجوم متعدد المراحل لاستخراج بيانات من شبكة مؤسسية.
ونجح نموذج GPT-5.5 في 3 محاولات من أصل 10، مقابل محاولتين فقط ل”ميثوس” ، في حين لم تتمكن أي نماذج سابقة من اجتياز هذا الاختبار ولو مرة واحدة. ومع ذلك، فشل كلا النموذجين في اجتياز اختبار أكثر تعقيدًا يُحاكي تعطيل أنظمة التحكم في محطة طاقة.
وتشير نتائج معهد أمن الذكاء الاصطناعي إلى أن المخاطر المرتبطة بالأمن السيبراني لا ترتبط بنموذج بعينه، بل تعكس تطورًا عامًا في قدرات الذكاء الاصطناعي، خصوصًا في مجالات الاستقلالية طويلة المدى، والاستدلال، والبرمجة.
وفي هذا السياق، انتقد الرئيس التنفيذي لشركة أوبن إيه آي، سام ألتمان، ما وصفه ب”التسويق القائم على التخويف” عند الترويج لبعض النماذج عبر تقييد الوصول إليها، في إشارة إلى نموذج “ميثوس” الذي قيدت “أنثروبيك” الوصول إليه ليكون محصورًا فقط على بعض الشركات والبنوك والهيئات.
وأشار ألتمان إلى أن تضخيم المخاطر قد يُستخدم كوسيلة تسويقية، رغم إقراره بقدرات نموذج “ميثوس” في مجال الأمن السيبراني.







