أعلنت شركة أنثروبيك نموذجها الجديد Claude Opus 4.5، الذي تقدّمه بوصفه “أفضل نموذج في العالم للبرمجة والوكلاء”، مؤكدةً أنه يتفوّق في عدة فئات من قدرات البرمجة حتى على أحدث نماذج جوجل Gemini 3.
ويأتي هذا الإطلاق مع أن النموذج لم يحقق بعدُ انتشارًا واسعًا على منصة LMArena المُخصصة لتقييم نماذج الذكاء الاصطناعي، إلى جانب استمرار التحديات الأمنية التي يعانيها معظم وكلاء الذكاء الاصطناعي، التي يمكنها تنفيذ بعض المهام نيابةً عن المستخدم.
وتقول الشركة إن Opus 4.5 يُقدّم تحسينات كبيرة مقارنةً بالإصدار السابق، خاصةً في البحث العميق، والتعامل مع الشرائح التقديمية وجداول البيانات. وأعلنت أنثروبيك أدوات جديدة ضمن نماذج Claude Code الموجّه للمبرمجين، بالإضافة إلى تحسينات في تطبيقات Claude الموجهة للمستخدمين، التي تهدف إلى دعم الوكلاء، وفتح طرق جديدة لاستخدام Claude داخل تطبيق Excel ومتصفح كروم وأجهزة الحاسوب المكتبية. ويتوفر النموذج اليوم عبر تطبيقات الشركة وواجهات البرمجة، إضافةً إلى منصات الخدمات السحابية.
وفي خطوة لمعالجة أبرز مخاوف مجتمع التقنية تجاه الوكلاء الأذكياء، ركزت أنثروبيك على قضايا الاستخدامات الخبيثة وهجمات حقن الأوامر (Prompt Injection)، التي تعتمد على إخفاء تعليمات ضارة داخل مواقع أو مصادر بيانات ليتجاوز النظام آليات الأمان ويقدّم استجابات مضللة أو حساسة، مستغلة الصلاحيات الواسعة الممنوحة للوكلاء.
وتؤكد الشركة أن Opus 4.5 “يصعب تضليله” مقارنةً بأي نموذج متقدم آخر، لكنها تقر بأن النظام غير “مُحصّن” بالكامل، وأن عددًا من الهجمات ما زال قادرًا على اختراقه.
وتشير الشركة أيضًا إلى إضافة اختبارات داخلية وخارجية جديدة تقيس قدرة النموذج على مقاومة الاستخدامات الخبيثة وهجمات الحقن في بيئات البرمجة واستخدام المتصفح والحاسوب.
وفي أحد التقييمات الخاصة بالبرمجة، الذي يفحص استجابة النموذج لـ150 طلبًا ضارًا محظورًا وفق سياسة أنثروبيك، نجح Opus 4.5 في رفض 100% من هذه الطلبات، وفقًا للشركة.
وفي المقابل، كانت نتائج الأمان أضعف عند اختبار النموذج ضمن بيئة البرمجة Claude Code؛ فعند تقييم قدرته على رفض طلبات مثل إنشاء برمجيات خبيثة، أو كتابة شفرات لهجمات DDoS التدميرية، أو تطوير أدوات مراقبة غير مشروعة، لم تتجاوز نسبة الرفض 78%.
وتعكس هذه النتائج – حتى مع التقدم الملحوظ – استمرار التحدّي الكبير أمام أنثروبيك وسائر المنافسين، وهو بناء نماذج قوية وآمنة، وقادرة على الإنجاز دون أن تكون عرضة للاختراق والاستغلال الخبيث.
