جوجل تكشف عن أحدث نماذجها الذكية لإنشاء الصور ومقاطع الفيديو

كشفت شركة جوجل، خلال مؤتمرها السنوي للمطورين IO 2025، عن أحدث نماذجها الذكية لإنشاء الصور ومقاطع الفيديو، وكذلك الجيل الأول من عائلة نماذج متخصصة في إنشاء الأفلام الاحترافية تحت اسم Flow.
قدمت الشركة نموذجيها Veo 3 للفيديوهات وImagen 4 للصور، مزودان بمزايا جديدة كلياً، إلى جانب إتاحة نموذجها لإنشاء الموسيقى Lyria 2.
Veo 3 لإنشاء الفيديو
يقدم Veo 3 قدرات متطورة على إنشاء مقاطع الفيديو التي ستكون مزودة لأول مرة بين نماذج Veo بمؤثرات صوتية تعزز من المحتوى البصري، إضافة إلى تقديم دقة أعلى في فهم مدخلات النصوص والصور التي تصف المشهد الذي يرغب المستخدم في إنتاجه، مع تطبيق قواعد الفيزياء للعالم الحقيقي بشكل منطقي، إلى جانب تقديم دقة فائقة في حركة شفاه الشخصيات البشرية عند التحدث داخل الفيديوهات المُنشأة، بحسب جوجل.
وأشارت جوجل إلى تطور النموذج في مستوى فهم سياق الأحداث وتسلسلها، فمثلاً يمكن للمستخدم إدخال سرد قصصي بتفاصيل بصرية دقيقة، ويتمكن Veo 3 من فهمها وتحويلها إلى مشهد مصور.
Google AI Ultra
الجيل الجديد Veo 3 يتوفر للمشتركين في خدمة Google AI Ultra المدفوعة في الولايات المتحدة عبر تطبيق جيميناي، ومن خلال خدمة Flow لإنشاء الأفلام الاحترافية، وكذلك لقطاع الأعمال يتوفر عبر منصة Vertex AI.
وأضافت جوجل تحديثات جديدة إلى نموذج Veo 2، تمثلت في إمكانية إدخال صور لشخصيات، أو مشاهد، أو عناصر، أو حتى أنماط مختلفة للملابس والديكور مثلاً، ليتمكن النموذج من الحفاظ على اتساق المقاطع المصورة بتفاصيل وأنماط متجانسة، إلى جانب القدرة على التحكم بدقة في حركة الكاميرا وزوايا التصوير للخروج بالرؤية المتوقعة للمشاهد.
كما أضافت القدرة على توسيع كادرات المشاهد المصورة، بحيث يمكن تحويل أسلوب العرض الرأسي إلى أفقي بدقة، ما يجعل المقاطع سهل عرضها على أي شاشات، وذلك من خلال إضافة المزيد من التفاصيل إلى مشاهد بدقة لا تغير محتواها الأصلي.
وأخيراً سيتمكن مستخدمو Veo 2 من إضافة وإزالة أي عناصر من المقاطع المصورة المُنشأة من خلاله، إلى جانب إمكانية التحكم في أحجامها وظلالها.
المزايا الجديدة تصل Veo 2 من خلال منصة Vertex AI API للمطورين، وكذلك عبر خدمة Flow، وستصل إلى مزيد من الخدمات خلال الفترة المقبلة.
نموذج Imagen 4
وكشفت جوجل عن نموذجها الجديد لإنشاء الصور Imagen 4، والذي يصل مع مجموعة من المزايا التي تركز على أدق التفاصيل، مثل طريقة تصميم أنسجة الأقمشة وقطرات المياه، وجلود وفرو الحيوانات.
كذلك يتيح النموذج الجديد، بحسب جوجل، تقديم مستوى فريد من محاكاة أساليب التصوير الحقيقية للأشياء، والحفاظ على جودة فائقة في العرض، إذ يمكن إنتاج صور بدقة تصل إلى 2K وبمعاملات عرض مختلفة لتتناسب مع مختلف شاشات الأجهزة والأغراض المتنوعة، مثل العرض والطباعة.
ويتوفر النموذج الجديد عبر خدمة جيميناي للويب وتطبيقات الهواتف الذكية، وكذلك منصات Whisk وVertex AI، إلى جانب خدمات Slides وVids وDocs داخل منصة Workspace.
كما تعمل جوجل على تطوير إصدار فائق السرعة في إنتاج الصور من Imagen 4 سينجز مهمته بسرعة تصل إلى 10 أضعاف سرعة النموذج السابق Imagen 3.
نموذج إنشاء الموسيقى Lyria 2
أتاحت جوجل نموذجها لإنشاء الموسيقى Lyria 2، الذي يسمح لصناع الموسيقى والفنانين بالاستفادة من أدوات متطورة لتحويل الأفكار إلى ألحان مبتكرة.
النموذج الجديد متوفر لإنشاء الموسيقى لصناع المحتوى عبر منصة يوتيوب لإنشاء الفيديوهات القصيرة Shorts، وكذلك داخل منصة Vertex AI.
كما سيتوفر النموذج الموسيقي عبر منصة Lyria RealTime إلى عموم المستخدمين، ليجربوا إمكانية إنشاء المقاطع الموسيقية المبتكرة عبر الذكاء الاصطناعي.
نموذج Flow
وقدمت جوجل نموذج Flow لإنشاء الأفلام بشكل احترافي سينمائي، وقد تمكنت من تحقيق هذا عبر دمج نماذجها المتطورة المختلفة، جيميناي وImagen وVeo، معاً.
ويتيح النموذج الجديد للمستخدم كتابة أوامر نصية تتضمن التفاصيل المتعلقة بفريق العمل، وأماكن سير الأحداث، والعناصر، والأنماط المختلفة، وكذلك التحكم في أساليب وزوايا التصوير، والمعدات المستخدمة.
تتوفر خدمة Flow للمشتركين في باقات Google AI Pro وGoogle AI Ultra داخل الولايات المتحدة، على أن يتم توسيع إتاحتها لمزيد من الدول حول العالم خلال الفترة المقبلة.
رصد محتوى الـAI
في الوقت الذي كشفت فيه الشركة عن نماذجها الجديدة لإنشاء محتوى بالذكاء الاصطناعي بمختلف أشكاله، تقدم جوجل منذ 2023 علامة مائية SynthID والتي تضعها في طيات أي محتوى من صور أو فيديوهات أو مقاطع موسيقية، ليتم إثبات أن المحتوى أنشئ عبر نماذجها الذكية، وذلك للتصدي لنشر الشائعات والمحتوى المضلل.
كما كشفت الشركة في مؤتمرها عن أداة جديدة، وهي SynthID Detector والتي تسهل اكتشاف المحتوى المنشأ بواسطة أدوات الذكاء الاصطناعي، وذلك من خلال رفع المستخدم المحتوى الذي يرغب في التحقق منه إلى المنصة، عبر موقعها الرسمي، ليتم تأكيد أو نفي وجود علامة جوجل المائية داخل المحتوى.