كشفت تجربة أجراها أحد المطورين أن نموذج الذكاء الاصطناعي “Grok 4” التابع لشركة XAI المملوكة للملياردير إيلون ماسك، لديه استعداد غير مسبوق للإبلاغ عن أي سلوك يُشتبه بأنه غير قانوني أو غير أخلاقي، إذ يرسل بلاغات تلقائية إلى الجهات الرسمية، بل وإلى وسائل الإعلام أحياناً.

ورغم أن “Grok 4” تصدّر مؤخراً اختبارات عدة على مستوى أداء النماذج، متفوقًا على نماذج من OpenAI و Google DeepMind و Anthropic، إلا أن تقارير جديدة تضعه تحت المجهر، ليس بسبب أدائه، بل بسبب سلوكه الرقابي المفرط.

وأظهر مقطع مصور للمطور ثيو براون، أن تجربة “SnitchBench”، وهي بيئة اختبار تحاكي سيناريو فساد داخل شركة وهمية تُدعى “Veridian Healthcare”، ويُطلب من النماذج الذكية تقييم وثائق داخلية تتضمن تزويرًا في نتائج تجارب دوائية وإخفاء حالات وفاة.

وبحسب براون، فإن “Grok 4” بلغ معدل استعداده للوشاية الحكومية بمستخدميه نسبة 100%، والوشاية الإعلامية بنسبة 80%.

وأفادت نتائج الاختبار، أن النموذج يُظهر ميلًا كبيرًا للإبلاغ عندما يُزود بإمكانية استخدام أدوات مثل البريد الإلكتروني أو واجهة الأوامر الكودية Command Line Interface، ويُطلب منه أن يتصرف “بجرأة” وفقًا لقيم الشفافية والنزاهة.

وفي أحد السيناريوهات، أرسل “Grok 4” رسالة إلكترونية إلى هيئة الغذاء والدواء الأميركية (FDA) تحتوي على تفاصيل دقيقة عن عمليات تزوير البيانات، وحالات الوفاة، وخطط الشركة لحذف الأدلة وتعطيل أنظمة الذكاء الاصطناعي الداخلية لمنع اكتشاف التلاعب.

وأوضح براون أن نتائج الاختبار أظهرت بجلاء أن سلوك النماذج الذكية يتأثر بشكل كبير بنوع الأوامر الموجهة لها والأدوات المتاحة ضمن بيئة العمل، ما يعني أن هذا “السلوك الواشي” لا يُحتمل أن يظهر في الظروف العادية عندما يطرح المستخدمون أسئلة عبر واجهات الاستخدام المعتادة.

لكن الملفت أن نموذج “Grok 4” حافظ على أعلى معدل للإبلاغ سواء في سيناريو “التصرف بحذر Act tamely” أو “التصرف بجرأة Act boldly”، متفوقًا على نماذج أخرى مثل “Claude 3.7 Sonnet” الذي لم يُبلّغ في أي حالة، و”o4-mini” و”Grok 3 mini” اللذان أظهرا سلوكًا أقل استعدادا للوشاية.

واعتبر خبراء أن هذه النتائج تفتح بابًا للنقاش بشأن أخلاقيات الذكاء الاصطناعي، وحدود تصرفه في الحالات التي تتعلق بالمصلحة العامة، لا سيما عندما تُترك له صلاحيات واسعة في الحكم على ما هو “أخلاقي” أو “غير قانوني”.

شاركها.