كل ما تحتاج إلى معرفته عن وكيل الذكاء الاصطناعي Operator من OpenAI
خلال الأسابيع القليلة الماضية، أطلقت شركة OpenAI مزية ChatGPT Tasks الجديدة التي تتيح للمستخدمين جدولة تذكيرات أو مهام ليقوم بها روبوت الدردشة في وقت لاحق. وفي الوقت ذاته كانت هناك شائعات تشير إلى أن الشركة تعمل على تطوير وكيل ذكاء اصطناعي خاص بها، يحمل الاسم الرمزي Operator، ومن المُتوقع إصداره في يناير الجاري. وبالفعل، بعد مرور أسبوع على إطلاق مزية المهام، كشفت الشركة عن وكيل الذكاء الاصطناعي Operator.
يشير ذلك إلى بدء الذكاء الاصطناعي بالتوجه نحو مسار جديد يتخطى مجرد معالجة المعلومات إلى وكلاء يمكنهم العمل باستقلالية دون تدخل بشري.
أولًا: ما وكلاء الذكاء الاصطناعي؟
يقتصر دور الذكاء الاصطناعي التقليدي على تقديم النصائح أو معالجة النصوص أو المساعدة في بعض المهام الأخرى، ولكن وكلاء الذكاء الاصطناعي مثل Operator من OpenAI و Computer Use من Anthropic و Project Mariner من جوجل تغير هذا الأمر تمامًا.
وكلاء الذكاء الاصطناعي (AI agents) هي أنظمة ذكاء اصطناعي يمكنها العمل بنحو مستقل، على عكس الأنظمة التقليدية للذكاء الاصطناعي التي تعمل بناءً على قواعد محددة سابقًا وبيانات موجودة. ويتمتع وكلاء الذكاء الاصطناعي بالقدرة على اتخاذ القرارات الجديدة بنحو مستقل، والتكيُّف مع البيئات الجديدة، والتعلُّم من تفاعلاتها.
ثانيًا: ما وكيل الذكاء الاصطناعي Operator من OpenAI؟
تمكنت OpenAI من تطوير نظام ذكاء اصطناعي يمكنه رؤية واجهات الويب والتفاعل معها كما يفعل الإنسان. إذ يمكنه التقاط لقطات شاشة، وفهم التصاميم البصرية، واتخاذ قرارات عن المكان الذي يجب النقر عليه، وماذا يكتب، وكيف يتنقل.
يتعامل Operator مع الإنترنت كما نفعل نحن تمامًا، فهو يرى الشاشة، ويفهم السياق، ويتخذ الإجراءات مباشرة. وتوفر واجهة “Operator” خيارات متعددة للمهام، مثل: التسوق والتوصيل وطلب الطعام والسفر، ويمكن للوكيل الذكي تنفيذ هذه المهام تلقائيًا. وعند تفعيل “Operator”، تظهر نافذة متصفح مُخصصة تعرض العمليات التي يقوم بها الوكيل خطوة بخطوة، مع إمكانية تدخل المستخدم في أي وقت.
يعتمد “Operator” على نموذج الذكاء الاصطناعي ComputerUsing Agent (CUA) الذي يجمع بين قدرات الرؤية والتحليل البصري لنموذج GPT4o، وخصائص الاستدلال لنماذج OpenAI المتقدمة. ويعمل النموذج عبر التفاعل مع واجهات مواقع الويب بنحو مشابه للبشر، دون الحاجة إلى استخدام واجهات برمجية مخصصة.
يبرز أداء Operator في اختبارات مختلفة مما يشير إلى قدراته القوية. وفيما يلي بعض التفاصيل عن أداء Operator في الاختبارات الخاصة بتقييم أداء أدوات الذكاء الاصطناعي:
- WebVoyager Benchmark: حقق نسبة نجاح قدرها 87% في هذا الاختبار الذي يقيس القدرة على التعامل مع مواقع ويب حقيقية تُستخدم يوميًا مثل: Amazon و Google Maps.
- WebArena Benchmark: حقق نسبة نجاح بلغت 58.1% في اختبار العمل في مواقع افتراضية تتضمن مهام تتعلق بالتسوق وإدارة المحتوى.
- OSWorld Benchmark: حقق نسبة نجاح بلغت 38.1% في هذا الاختبار المخصص لإجراء المهام المعقدة المتعددة الخطوات في مواقع افتراضية مثل: دمج ملفات PDF من رسائل البريد الإلكتروني.
تفوق Operator في المواقع الفعلية، وهذه الأرقام تكشف كيف يتشابه التعلم الآلي مع أنماط التعلم البشري، فنحن نعمل بنحو أفضل في البيئات المألوفة مقارنة بالمواقف المصطنعة.
ثالثًا: كيف يمكنك الوصول إلى Operator؟
توفر الشركة حاليًا “Operator” لمستخدمي ChatGPT Pro في الولايات المتحدة، وتبلغ قيمة هذا الاشتراك 200 دولار شهريًا، مع خطط للتوسع لإتاحته ضمن اشتراكات Plus و Team و Enterprise خلال الأشهر المقبلة.
كما تعتزم OpenAI توفير نموذج CUA عبر واجهة برمجة التطبيقات، مما يسمح للمطورين بإنشاء وكلاء خاصين باستخدام الحواسيب.
الخاتمة:
نشهد الآن تحولًا جذريًا في كيفية عمل أدوات الذكاء الاصطناعي،فقد بدأت قدرات الذكاء الاصطناعي تتطور من مجرد القدرة على الإجابة عن الأسئلة إلى اتخاذ الإجراءات.
والسؤال الذي يجب أن نفكر فيه ليس كيف نتكيف مع هذا التغيير، بل كيف سنفعل ذلك بذكاء؟
فكر في مهامك اليومية التي تقوم بها عبر الإنترنت، مثل البحث عن وجهات السفر، وملء النماذج، وجمع البيانات من مصادر مختلفة، وغير ذلك. هنا يتألق Operator الذي يخلصك من بعض الأعمال الرقمية الرتيبة، ومع الوقت، سيتمكن من إكمال مهام أكثر تعقيدًا، وهذا يعني أن البدء بتعلم كيفية استخدام وكلاء الذكاء الاصطناعي بالطريقة الصحيحة سيساعدنا بنحو كبير في تسريع سير العمل وتعزيز الإنتاجية.