هل يتفوق نموذج “Grok 3” على كافة نماذج الذكاء الاصطناعي المنافسة؟

أطلق إيلون ماسك خلال الأسبوع الماضي نموذج (Grok 3)، الجيل الأحدث من نموذج الذكاء الاصطناعي التوليدي الذي طورته شركته xAI، مدعيًا تفوقه الكبير على الإصدارات السابقة وكافة نماذج الذكاء الاصطناعي المنافسة.
إذ لم يتردد ماسك في وضع نموذج (Grok 3) في مواجهة مباشرة مع عمالقة الذكاء الاصطناعي، مدعيًا تفوقه على نموذج (GPT4o) من OpenAI، بالإضافة إلى نماذج جوجل، وميتا، و DeepSeek، وAnthropic. وأكد أن هذا الادعاء يستند إلى اختبارات داخلية مبكرة زعم أنها أظهرت تفوق النموذج في معايير رئيسية في الرياضيات والعلوم والبرمجة.
ولم يخفٍ ماسك حماسه تجاه التطور السريع لنموذج (Grok 3) خلال البث المباشر لحدث الإطلاق عبر منصة إكس، مؤكدًا أن التحسينات مستمرة بوتيرة يومية، ويثير هذا الوعد بالتطوير المستمر تساؤلات حول مستقبل النموذج وتأثيره المحتمل في مختلف جوانب حياتنا.
ومع ذلك، لم تكن ردود الفعل الأولية من الباحثين والخبراء في مجال الذكاء الاصطناعي متجانسة، إذ تباينت الآراء حول مدى صحة هذه الادعاءات، ويفتح هذا التباين الباب أمام العديد من التساؤلات، مثل: هل يرتقي نموذج (Grok 3) إلى مستوى التوقعات؟ وهل يمكن أن يشكل حقًا قفزة نوعية في مجال الذكاء الاصطناعي التوليدي؟
لذلك سنقدم في هذا المقال، تحليل تفصيلي لنموذج (Grok 3)، مستعرضين ادعاءات ماسك، ومقارنين إياها بردود فعل الخبراء، ومستكشفين الإمكانات والتحديات التي تواجه هذا النموذج الجديد.
أولًا؛ ما قدرات نموذج (Grok 3) ومزاياه؟
يمثل نموذج (Grok 3) عائلة متطورة من النماذج اللغوية الكبيرة ونماذج الاستدلال، وفقًا لما أعلنته شركة (xAI)، ومع ذلك لا تزال التفاصيل الدقيقة حول حجمه وبنيته وآليات تدريبه غير متاحة في الوقت الحالي.
ويُعدّ (Grok 3) الأساسي نموذج لغوي كبير متعدد الأغراض، مصمم خصوصًا لمنافسة النماذج الرائدة في السوق مثل: GPT4o، و Claude 3.5 Sonnet، و Gemini 2.0، ويتميز هذا النموذج بقدرته على أداء مجموعة واسعة من المهام، بما يشمل: إنشاء النصوص بعشرات اللغات، منها العربية والإنجليزية، وإجراء العديد من أشكال المعالجة على النصوص، مثل تلخيصها وإعادة صياغتها، وتوليد الصور وتوليد التعليمات البرمجية.
وفي خطوة تهدف إلى إدماج الذكاء الاصطناعي بسلاسة في تجربة المستخدم، وضعت منصة إكس زرًا مخصصًا لروبوت (Grok) مباشرة داخل مربع كتابة المنشورات، ويظهر هذا الزر للمستخدم سواء كان يكتب منشورًا نصيًا عاديًا أو يقوم بإعداد منشور يتضمن صورًا مرفقة، ويتيح هذا التكامل للمستخدمين الاستفادة من قدرات النموذج بنحو مباشر وسهل أثناء إنشاء المحتوى.
ويتوفر (Grok 3) بحجمين: النموذج الكامل وإصدار (Grok 3 mini)، مما يتيح للمستخدمين اختيار الحجم الذي يناسب احتياجاتهم، على غرار النماذج الأخرى التي تقدمها شركات مثل: جوجل، و OpenAI، و Anthropic.
أما (Grok3 Reasoning Beta)، فهو الإصدار المتخصص في الاستدلال من هذه العائلة، ويشبه هذا النموذج نماذج أخرى مثل: OpenAI o3، و DeepSeekR1، و Gemini 2.0 Flash Thinking. إذ يعتمد على تقنية التعلم التعزيزي (RL) على نطاق غير مسبوق، بهدف تحسين إستراتيجيات حل المشكلات، وتصحيح الأخطاء من خلال التتبع، وتبسيط الخطوات، وكذلك تحقيق الاستفادة القصوى من المعرفة التي اُكتسبت خلال مرحلة التدريب.
وقد جعلت هذه القدرات النموذج قادر على التعامل مع المسائل المعقدة بطريقة تشبه إلى حد كبير الطريقة التي يتبعها الإنسان، إذ يستغرق النموذج وقتًا يتراوح بين بضع ثوانٍ وعدة دقائق للتفكير في الحل، تمامًا كما يفعل الإنسان عند مواجهة مشكلة معقدة، وخلال هذه المدة؛ يقوم النموذج بتقييم طرق حل متعددة، والتحقق من صحة الحلول التي يقترحها، وتقييم مدى تلبيتها لمتطلبات المشكلة بدقة.
ولتحقيق هذه القدرات، يعمل نموذج (Grok 3) في ثلاثة أوضاع مختلفة، وهي:
1 وضع التفكير (Think):
يُفعّل هذا الوضع قدرة النموذج على الاستدلال المنطقي، مما يسمح له بتقسيم المشكلات إلى سلسلة من الخطوات الصغيرة، أو ما يُعرف باسم (الأفكار)، وتكون معظم هذه الأفكار مرئية للمستخدمين، مما يوفر شفافية في عملية التفكير التي يتبعها النموذج.
ومع ذلك، وأشار ماسك إلى أن بعض هذه الأفكار ستكون محجوبة لتجنب استغلال النماذج الأخرى لها، واستخلاص المعلومات منها، وهي تقنية تُعرف باسم (التقطير) Distillation، وهي تقنية يستخدمها مطورو الذكاء الاصطناعي لاستخراج المعرفة من نماذج أخرى لتدريب نماذجهم.
ويعتمد هذا الوضع على (Grok 3 Mini)، وهي نسخة أقل استهلاكًا للموارد الحاسوبية، مما يجعلها مثالية للاستخدام في التطبيقات التي تتطلب استجابة سريعة وكفاءة عالية في استخدام الموارد، مثل: حل الاستعلامات البسيطة في مجالات مثل الرياضيات والعلوم والبرمجة.
2 وضع (Big Brain):
يشبه هذا الوضع وضع (Think) في تفعيل قدرات الاستدلال، ولكنه يستخدم النسخة الكاملة من نموذج (Grok 3)، مما يُمكّنه من التعامل مع الاستعلامات الأكثر تعقيدًا وتطلبًا.
وتأتي هذه القوة الإضافية بتكلفة زمنية، إذ يستغرق النموذ وقتًا أطول لمعالجة المدخلات عند تفعيل وضع (Big Brain)، ومع ذلك، يُعدّ هذا التأخير الزمني استثمارًا ضروريًا للحصول على استجابات أكثر دقة وتفصيلًا.
لذلك يُعدّ وضع (Big Brain) مثاليًا للاستخدام في المجالات التي تتطلب تفكيرًا منطقيًا متقدمًا وتحليلًا عميقًا، مثل البحث العلمي، ومهام الذكاء الاصطناعي المتعددة الطبقات، وسيناريوهات حل المشكلات الشديدة التعقيد. ففي هذه المجالات، قد لا يكون الاستدلال القياسي كافيًا للتعامل مع التحديات المطروحة، مما يجعل هذا الوضع أداة قيمة للباحثين والعلماء والمهندسين الذين يسعون إلى حل المشكلات الأكثر تعقيدًا.
3 وضع (DeepSearch):
يتيح وضع (DeepSearch) لنموذج (Grok 3) الاتصال المباشر بالإنترنت، مما يسمح له بتصفح الويب، والتحقق من مصادر المعلومات، وتوليف البيانات لحظيًا قبل تقديم الإجابة النهائية.
ويعني ذلك أن معرفة النموذج لا تقتصر على المعلومات التي دُرب عليها، بل يمكنه الوصول إلى أحدث البيانات والمعلومات المتاحة عبر الإنترنت، مما يجعله مثاليًا لمهام تتطلب معلومات حديثة ودقيقة، مثل: جمع الأخبار، وتتبع الأسواق المالية، والتحقق من الحقائق.
لذلك يُعدّ وضع (DeepSearch) بمنزلة محرك بحث مدعوم بالذكاء الاصطناعي، وخطوة نحو تطوير وكلاء ذكاء اصطناعي قادرين على التفكير وإكمال المهام المعقدة مثل البشر، وفقًا لشركة (XAI).
ثانيًا؛ هل يتفوق (Grok 3) على كافة نماذج الذكاء الاصطناعي المنافسة؟
تشير البيانات النظرية إلى أن نموذج (Grok 3) يتفوق أو يضاهي نماذج الذكاء الاصطناعي الرائدة في معايير الأداء الرئيسية، وقد قدم فريق (xAI) عروضًا مباشرة خلال إعلان النموذج، توضح تفوق (Grok 3) على (GPT4o) في مقاييس مثل: (AIME) لتقييم مهارات الذكاء الاصطناعي في الرياضيات، و(GPQA)، الذي يقيس أداء النموذج في الفيزياء والأحياء والكيمياء على مستوى الدكتوراه، وذلك وفقًا لاختبارات داخلية.
كما حقق النموذج نتائج متقدمة في منصة (Chatbot Arena)، التي تعتمد على تقييم المستخدمين لإجابات نماذج الذكاء الاصطناعي دون معرفة مصدرها.
https://t.co/hEfQ31gANQ
— xAI (@xai) February 18, 2025
ومع ذلك، لم تكن ردود الفعل العامة متجانسة، فقد أشاد بعض المستخدمين بأداء نموذج (Grok 3)، وقدموا أمثلة على قدرته على إنشاء ألعاب كاملة الوظائف باستخدام طلب واحد فقط، في حين، انتقد آخرون أداء النموذج في بعض المهام، مشيرين إلى أنه يقدم أداءً أقل مقارنة بنماذج مثل: OpenAI o3mini و Claude 3.5 Sonnet.
ثالثًا؛ ما آراء الخبراء حول أداء النموذج؟
أثار إطلاق نموذج (Grok 3) ردود فعل متباينة من خبراء الذكاء الاصطناعي، فقد قدم أندريه كارباثي، المؤسس المشارك لشركة OpenAI والرئيس السابق لعمليات الذكاء الاصطناعي في تسلا، تقييمًا أوليًا للنموذج. وذكر كارباثي في منشور عبر منصة إكس أن نموذج (Grok 3) نجح في إنجاز مهام معقدة مثل استخلاص المعلومات من الأوراق البحثية التدريبية. ومع ذلك، لاحظ كارباثي أن النموذج واجه صعوبات في حل ألغاز لعبة (Tic Tac Toe) المعقدة، على غرار نموذج o1pro من OpenAI.
I was given early access to Grok 3 earlier today, making me I think one of the first few who could run a quick vibe check.
Thinking
✅ First, Grok 3 clearly has an around state of the art thinking model (“Think” button) and did great out of the box on my Settler’s of Catan… pic.twitter.com/qIrUAN1IfD— Andrej Karpathy (@karpathy) February 18, 2025
وبالنظر إلى تجربته المبكرة مع النموذج صرح كارباثي بأن النموذج يقع في مكان ما حول مستوى قدرات نموذج o1pro، ويتفوق على نموذج DeepSeekR1. ولكنه أكد ضرورة إجراء تقييمات أكثر دقة وشمولية للتحقق من هذه النتائج.
كما أشار كارباثي إلى أن وضع (DeepSearch) في النموذج يقارب في أدائه أداة (DeepResearch) من Perplexity، ولكنه لا يزال أقل شمولية وموثوقية من أداة (DeepSearch) التي أطلقتها شركة (OpenAI) حديثًا.
ومن جانبه، أبدى إيثان موليك، الأستاذ في كلية وارتون بجامعة بنسلفانيا، رأيًا أكثر تحفظًا، إذ أكد أن نموذج (Grok 3) ليس نموذجًا رائدًا بشكل واضح. وكتب موليك في منشور عبر حسابه في منصة لينكدإن أن (Grok 3) هو نموذج قوي، ولكنه لا يصل إلى مستوى يجعله بديلًا للنماذج الرائدة الحالية.
وأشار إلى أن نموذج (Grok 3) يتفوق على بعض نماذج OpenAI في معايير محددة، ولكنه لا يتفوق بشكل واضح على نموذج o3 من OpenAI.
أما جاري ماركوس، المؤسس لشركة (Geometric Intelligence)، والمعروف بانتقاداته الحادة للضجيج المحيط بالذكاء الاصطناعي، فقد كان الأكثر تشككًا. وكتب ماركوس في مقال عبر مدونته، أن وعود إيلون ماسك بجعل نموذج (Grok 3) أذكى نموذج ذكاء اصطناعي لم تتحقق.
ووصف ماركوس حدث الإطلاق بأنه نسخة مكررة من العروض السابقة، مؤكدًا أنه لم يشهد أي تغيير جذري في أداء نموذج (Grok 3) مقارنة بنماذج OpenAI.
وعلى النقيض من ذلك، كان كارباثي أكثر إيجابية، إذ أشاد بقدرات الاستدلال المنطقي لنموذج (Grok 3) ووصفها بأنها “من أحدث التقنيات”، كما سلط الضوء على قدرة النموذج على حل مشاكل البرمجة المعقدة، مما يشير إلى تقدم ملحوظ في هذا المجال.
باختصار، يظهر لنا من هذه الآراء المتباينة أن (Grok 3) يمثل نموذجًا واعدًا بقدرات متقدمة، ولكنه لا يزال بحاجة إلى المزيد من التقييم والاختبار لتحديد موقعه بدقة في ساحة نماذج الذكاء الاصطناعي الرائدة.
رابعًا؛ صراع ماسك وألتمان ومستقبل (Grok 3):
يأتي إطلاق نموذج (Grok 3) في ظل تصاعد التوترات بين إيلون ماسك وسام ألتمان، الرئيس التنفيذي لشركة (OpenAI)، إذ يوجد تنافس قوي بينهما يمتد لسنوات، وقد وصل إلى ذروته هذا الشهر عندما قاد ماسك محاولة استحواذ غير متوقعة بقيمة قدرها 97.4 مليار دولار للسيطرة على OpenAI، الشركة التي شارك في تأسيسها مع ألتمان عام 2015 قبل أن ينسحب منها عام 2018 بسبب خلافات في الرؤى.
وقد رفض مجلس إدارة (OpenAI) هذا العرض بشكل قاطع، مما زاد من حدة التوتر بين الطرفين، وسينعكس ذلك قطعًا على المنافسة بين كل من ماسك وألتمان في مجال الذكاء الاصطناعي.
ومع أن نموذج (Grok 3) يتمتع بقدرات متطورة، يرى إيثان موليك، أن شركة (OpenAI) تحتفظ بميزة تنافسية قوية تتمثل في شراكاتها الواسعة في الصناعة وتبني المؤسسات لتقنياتها، وأشار موليك إلى أنه غير متأكد من قدرة (Grok 3) على إحداث اختراق كبير في السوق.
ويتفق جاري ماركوس، مع هذا الرأي، مؤكدًا أن (OpenAI) لا تحتاج إلى القلق حاليًا، وقال ماركوس: “يمكن لسام ألتمان أن يرتاح قليلًا الآن، فلا يوجد تقدم ثوري ملحوظ هنا”، مؤكدًا أن (Grok 3) لا يمثل قفزة نوعية حقيقية في الأداء.
وأضاف أن هيمنة OpenAI على الوصول إلى موارد الحوسبة الضخمة، إلى جانب نطاق أبحاثها الواسع، تظل درعًا متينًا يصعب اختراقه.
ومع ذلك، يؤكد إيلون ماسك أن نموذج (Grok 3) يمتلك قوة حوسبة تفوق الإصدار السابق بأكثر من 10 أضعاف، وأنه أكمل مرحلة التدريب السابق في أوائل شهر يناير 2025.
وبعد أيام من إطلاق (Grok 3) لمشتركي خدمة (بريميوم بلس) في منصة إكس، أعلن ماسك إتاحته مجانًا لجميع المستخدمين لمدة قصيرة، ولم يحدد إلى متى ستستمر هذه المدة الزمنية.
For a short time, Grok 3 is available for free to all! https://t.co/r5iLXi2pBm
— Elon Musk (@elonmusk) February 20, 2025
وفي خطوة تهدف إلى تعزيز الشفافية والتعاون في مجال الذكاء الاصطناعي، أعلن ماسك أن شركة (xAI) تخطط لفتح المصدر للإصدارات السابقة من نماذجها بمجرد أن يصل الإصدار الأحدث إلى مرحلة النضج، ووفقًا لتقديراته، من المتوقع أن يحقق (Grok 3) هذا الهدف خلال بضعة أشهر، مما يعزز التوقعات بمزيد من التطورات في الأفق.