أعلنت شركة جوجل رسميا عن إطلاق نموذجها الجديد Gemini 2.5 Flash Image – الذي يلقبه مجتمع المطورين باسم nano-banana – في خطوة تعيد رسم ملامح مستقبل الصور المولدة بالذكاء الاصطناعي.
لا يقتصر النموذج الجديد على إنشاء صور جميلة من أوامر نصية، بل يتيح دمج صور متعددة في لقطة واحدة، والحفاظ على ثبات الشخصيات أو العناصر عبر عدة مشاهد، إلى جانب تحرير الصور باستخدام اللغة الطبيعية، مع الاستفادة من قاعدة معارف Gemini الواسعة لتحقيق دقة أكبر وواقعية أوضح.
لماذا يعد هذا الإصدار مهما؟
عند طرح Gemini 2.0 Flash في وقت سابق من هذا العام، أعجب المطورون بسرعة النموذج وانخفاض تكلفته، لكنهم طالبوا بجودة أعلى وتحكم أوسع، الإصدار الجديد Gemini 2.5 Flash Image جاء استجابة مباشرة لهذه المطالب، حيث يعالج 3 تحديات رئيسية:
- الثبات: الحفاظ على هوية الشخصيات أو المنتجات أو العلامات التجارية عبر أكثر من صورة.
- الدقة: القدرة على تعديل أجزاء محددة من الصورة بمجرد أوامر نصية.
- المعرفة السياقية: فهم أعمق للعالم الواقعي يقلل من الأخطاء أو المعلومات غير الدقيقة.
أبرز المزايا
- الحفاظ على اتساق الشخصيات عبر مشاهد متعددة.
- دمج الصور أو ما يعرف بـ multi-image fusion.
- تحرير مباشر بالاعتماد على الأوامر النصية (إزالة عنصر، تغيير تعبير، إصلاح تفاصيل).
- الاستفادة من المعرفة الواقعية لنماذج جوجل اللغوية في إنتاج صور أكثر دقة.
- قوالب جاهزة في Google AI Studio لتسهيل التجارب الأولية.
- إضافة علامة مائية غير مرئية بتقنية SynthID لضمان الاستخدام الأخلاقي.
تطبيقات عملية
- التسويق والإعلانات: صور منتجات متسقة عبر الحملات.
- المحتوى الإبداعي: شخصيات متكررة للقصص المصورة أو الفيديوهات.
- التجارة الإلكترونية: تصميم صور توضيحية للمنتجات في بيئات متعددة.
- التعليم: تحويل الرسومات الأولية إلى مخططات تعليمية دقيقة.
- المطورون: بناء أدوات تحرير صور مخصصة داخل AI Studio.
السعر والتوفر
يتوفر Gemini 2.5 Flash للمطورين والمؤسسات بسعر 30 دولارا لكل مليون رمز إخراج، بينما تعادل تكلفة الصورة الواحدة نحو 0.039 دولار فقط.
أما داخل تطبيق Gemini، فيمكن للمستخدمين العاديين الاستفادة من القدرات الجديدة مباشرة من خلال الأوامر النصية، وتضيف جوجل علامة مائية مرئية وأخرى رقمية غير مرئية بتقنية SynthID لضمان الشفافية والتأكيد على أن الصور مولدة بالذكاء الاصطناعي.
النموذج متاح الآن عبر:
- Gemini API لدمج مباشر مع التطبيقات.
- Google AI Studio للتجارب السريعة.
- Vertex AI للاستخدام المؤسسي واسع النطاق.