أعلنت جوجل إطلاق نموذج توليد الصور وتعديها Gemini 3 Pro Image، الذي يُعرف أيضًا باسم Nano Banana Pro، وهو يُعد أحدث نموذج لتوليد وتحرير الصور ضمن منظومة نماذج الذكاء الاصطناعي Gemini، ليشكّل نقلة نوعية في دمج التصميم البصري مع الذكاء الاستدلالي والمعرفة الواقعية، وفقًا لجوجل.
ويقدّم النموذج الجديد، المبني على نموذج Gemini 3 Pro، مستوى غير مسبوق من الدقّة والتخصيص، وهو متاح عالميًا بدءًا من اليوم داخل تطبيق Gemini عبر خيار “Create image” باستخدام نموذج “التفكير Thinking” مع حصص استخدام مجانية محدودة، ويمكن لكافة المستخدمين تجربته الآن.
ويأتي Nano Banana Pro كترقية جذرية لأول جيل من نموذج Nano Banana الذي حقق انتشارًا واسعًا بفضل قدراته في توليد الصور وتعديلها، مع أدوات تحرير وتصميم موجهة للمبدعين والطلاب والمتخصصين والمؤسسات على حد سواء.
تحويل أي فكرة إلى تصميم جاهز
يتيح Nano Banana Pro للمستخدم تحويل أي فكرة إلى مخطط مرئي متكامل، سواء كان نموذجًا أوليًا (Prototype)، أو إنفوغرافيك، أو وصفات يمكن تحويلها لخطوات مرئية، أو بيانات آنية مثل الطقس والرياضة، أو ملاحظات مكتوبة بخط اليد تتحول تلقائيًا إلى مخطط منسق.
ويعتمد النموذج على آلية تُسمى “الارتكاز على البحث Search grounding”، وهي آلية تجعل نموذج الذكاء الاصطناعي لا يعتمد فقط على ما دُرّب عليه، بل يتصل مباشرة بنتائج بحث جوجل الحقيقية والآنية ليجلب معلومات دقيقة ويستخدمها داخل الصورة أو النص الذي يُنتجه، بمعنى أن النموذج لا يتخيل فقط، بل يستند إلى مصادر موثوقة ومحدَّثة من الويب قبل أن يُظهر النتيجة.
وعلى سبيل المثال: إذا طُلب منه إنشاء صورة “لخريطة الطقس الحالية في القاهرة”، فسوف يجلب النموذج بيانات الطقس من بحث جوجل في اللحظة نفسها، ثم يدمجها في الصورة. ولو طُلب منه إنشاء “إنفوغرافيك عن مباراة ريال مدريد الليلة”، سوف يأخذ الأرقام والنتائج الحقيقية من بحث جوجل ويعرضها بصريًا.
نصوص دقيقة ومتعددة اللغات داخل الصورة
يتميز Nano Banana Pro بقدرته على إنتاج نصوص طويلة داخل الصور (فقرات كاملة)، وتصميم الشعارات والخطوط الفنية (Calligraphy) بأنماط متعددة، ودعم لغات مختلفة مع ترجمة محتوى الصورة مباشرة دون تشويه التصميم، وإدماج النص في المشاهد بطرق إبداعية وملموسة.
وتؤكّد جوجل أن هذا هو أفضل نموذج لديها على الإطلاق في التعامل مع النصوص داخل الصور، من ناحية الدقة والوضوح.


دمج الصور بطريقة فريدة
يتيح النموذج إدماج ما يصل إلى 14 صورة معًا في صورة واحدة، مع الحفاظ على اتساق ما يصل إلى 5 أشخاص داخلها، ويوفر النموذج قدرة فريدة على جمع عناصر متعددة في مشهد واحد دون فقدان الهوية البصرية للشخصيات، مما يجعله مناسبًا لصناعة المحتوى، والتسويق، وتصميم الواجهات، والسينما والتحريك، والأزياء والتصوير الإعلاني. كما يمكنه تحويل الرسومات الأولية إلى منتجات واقعية، أو تحويل المخططات الهندسية إلى نماذج ثلاثية الأبعاد عالية الواقعية.


تحكم إبداعي بجودة سينمائية
يمنح Nano Banana Pro المستخدم أدوات تحرير احترافية تشمل تحرير جزء محدد من الصورة بدقة (Localized editing)، وتغيير زوايا الكاميرا، وتغيير عمق المجال ونقطة التركيز (Depth of field)، وتطبيق تصحيح لوني احترافي، ومحاكاة الإضاءة السينمائية (Chiaroscuro)، وتحويل المشهد من النهار إلى الليل، مع دعم الدقة البالغ قدرها 2K و 4K ونسب أبعاد مختلفة ملائمة لأغراض الطباعة والنشر.



شفافية عالية للمحتوى المولّد بالذكاء الاصطناعي
تعزّز جوجل معايير الأمان والشفافية في المحتوى المولّد عبر نموذج Nano Banana Pro من خلال دمج تقنية SynthID، وهي علامة رقمية غير مرئية تُضمَّن تلقائيًا داخل الصور المُولَّدة بنماذجها. ويمكن للمستخدمين رفع أي صورة داخل تطبيق Gemini للتحقّق مما إذا كانت قد صُنعت عبر نماذجها، على أن يتوسع هذا الدعم قريبًا ليشمل الصوت والفيديو أيضًا.
وإلى جانب العلامة غير المرئية، تضع الشركة علامة مائية مرئية للمستخدمين أصحاب الخطة المجانية وخطة Google AI Pro، في حين تُزال كليًا لمشتركي Google AI Ultra وللمطورين عبر منصة Google AI Studio، كما تعتمد جوجل بروتوكول C2PA لدعم معايير عالمية تتيح تمييز المحتوى المُنشأ بالذكاء الاصطناعي بطريقة موحدة وشفافة.

إطلاق Nano Banana Pro
تشير الشركة إلى أن نموذج Nano Banana Pro بدأ يصل إلى مختلف منتجات منظومة جوجل، سواء للمستخدمين العاديين في تطبيق Gemini عالميًا أو في وضع الذكاء الاصطناعي في بحث جوجل.
ويتوفر النموذج في منصة تدوين الملاحظات والبحث والدراسة NotebookLM، إضافةً إلى حضوره في أدوات المحترفين، مثل Google Ads و Google Slides و Google Vids، فضلًا عن توفره للمطورين عبر Gemini API و Google AI Studio ومنصة Google Antigravity لتطوير واجهات الاستخدام، وصولًا إلى Vertex AI الموجّه للإنتاج المؤسسي الواسع النطاق، مع خطط لإطلاق Gemini Enterprise قريبًا. وأما صناع المحتوى المرئي وصنّاع الأفلام فسيكون بإمكانهم استخدام أداة Flow الجديدة، المتاحة أولًا لمشتركي خطة Ultra.

انتقال من تحرير الصور إلى “ذكاء بصري كامل”
ترى جوجل أن Nano Banana Pro يمهّد لمرحلة جديدة تتجاوز تحرير الصور التقليدي نحو “ذكاء بصري كامل”؛ فالنموذج قادر – بحسب الشركة – على تحليل البيانات وتلخيص المعلومات بصريًا، ودعم المخرجين والمصممين، وتسريع تطوير الحملات الإعلانية، وتحويل الأفكار الأولية إلى نماذج فائقة الواقعية.
وتشير جوجل إلى أن أول نسخة من Nano Banana قد جذبت أكثر من 13 مليون مستخدم جديد لتطبيق Gemini خلال أربعة أيام فقط، ويستهدف Nano Banana Pro اليوم الاستخدامات الاحترافية والسينمائية على نطاق أوسع.
ومع هذا الإطلاق، تؤكد جوجل رغبتها في قيادة السباق المتسارع في الذكاء الاصطناعي البصري، مقابل منافسين مثل OpenAI. وبفضل قدرات الاستدلال، ودعم البيانات الواقعية، والتحكم الإبداعي العالي الدقة، تفتح الشركة الباب أمام حقبة جديدة من إنتاج الصور؛ وهي صور تفهم ما بداخلها وما حولها، وليس فقط صورًا تولَّد من فراغ.
