نموذج سري.. “نانو بنانا” يطرح أسئلة جديدة حول مستقبل الذكاء الاصطناعي من غوغل

نموذج «نانو بنانا» لتوليد الصور يمثل نقلة نوعية في عالم الذكاء الاصطناعي، حيث يجمع بين دقة التفاصيل وسرعة الأداء، ليقدم تجربة جديدة تتفوق على العديد من النماذج الحالية، محدثًا تغييرات جذرية في طرق إنتاج المحتوى الرقمي والتصميم الإبداعي. يظهر هذا النموذج كأحد أهم الإنجازات في مجال توليد الصور باستخدام الذكاء الاصطناعي، ما يجعله محط أنظار المطورين والمصممين حول العالم.

أول الظهور لنموذج «نانو بنانا» لتوليد الصور في بيئة تنافسية

كان الظهور الأول لنموذج «نانو بنانا» على منصة LMArena الشهيرة لاختبار نماذج الذكاء الاصطناعي في بيئة مجهولة، حيث يستخدم وضع «المعركة» لمقارنة أداء نموذجين في توليد أفضل صورة ممكنة، ولاحظ المستخدمون تفوقًا ملحوظًا لنموذج مجهول الهوية يتميز بالحفاظ على اتساق ملامح الوجوه، وفهمه الدقيق للأوامر المعقدة، وقدرته على تطبيق منطق المشهد بشكل لا يضاهى. ساهمت ظهور إشارات متكررة لرَمْز الموز في الصور المنشورة، فضلاً عن بعض التغريدات التي قام بها مهندسو غوغل، في إطلاق اسم «نانو بنانا» على هذا النموذج الغامض في أوساط مجتمع الذكاء الاصطناعي.

مميزات نموذج «نانو بنانا» لتوليد الصور التي تضعه في الصدارة

يتفرد نموذج «نانو بنانا» بعدة قدرات تجعل منه قوة رائدة في توليد الصور باستخدام الذكاء الاصطناعي، لا تقتصر فقط على الأداء السريع، بل تتعداه إلى إمكانية التحرير المباشر للصور باللغة الطبيعية، مما يسهل على المستخدمين تعديل الصور بأوامر نصية بسيطة دون الحاجة إلى أدوات معقدة مثل الفوتوشوب؛ فمثلًا، يمكن طلب «استبدال الخلفية بغابة» أو «إضافة إضاءة خافتة» ليقوم النموذج بتنفيذ التعديلات بسرعة ودقة عالية.

كما يعالج النموذج مشكلة كبيرة تواجه نماذج الذكاء الاصطناعي الحالية، وهي التغييرات الملحوظة في ملامح الشخصيات بعد التعديل، حيث يحافظ «نانو بنانا» على هوية الشخصية بشكل كامل رغم تغيير الخلفية أو الزوايا أو الألوان، ما يفتح آفاقًا واسعة للمصممين ومنتجي القصص المصورة.

أما من حيث السرعة، فالنموذج يتمكن من توليد صورة جديدة في ثانية إلى ثانيتين فقط، مقارنةً مع النماذج الأخرى التي قد تستغرق حتى 15 ثانية، ما يجعل تجربة التفاعل أقرب إلى العمل في الوقت الحقيقي، ويتميز كذلك بقدرته على إنتاج سرد قصصي متماسك عبر توليد عدة صور مترابطة مع الحفاظ على نمط وحكاية متناسقة، وهو أمر يفضّله الكثير من منتجي المحتوى والحملات الإعلانية.

التكهنات والتطبيقات العملية لنموذج «نانو بنانا» لتوليد الصور

رغم عدم صدور أي إعلان رسمي، تشير الأدلة بقوة إلى أن شركة غوغل تقف وراء نموذج «نانو بنانا»، وذلك بسبب التشابه في السلوك والقدرات مع إصدارات «جيميني» الحديثة متعددة الوسائط، إضافةً إلى اعتمادها على أسلوب الإطلاق السري الذي يسمح للمجتمع التقني باكتشاف النموذج تدريجيًا، وهو ما يتوافق مع أساليب شركة ديب مايند التابعة لغوغل في اختبارات النماذج السابقة، ويؤكد الخبراء أن هذا النموذج لا يمكن أن يكون من إنتاج فريق صغير، بل نتاج بيئة بحث عظيمة مثل غوغل أو OpenAI نظرًا لتفوقه في فهم التعليمات والسياق بشكل استثنائي.

تتنوع تطبيقات «نانو بنانا» في مجالات عدة حيث بدأ بعض الفرق باختباره في بيئات مغلقة لتحقيق نتائج ملموسة؛ فمثلًا في قطاع التجارة الإلكترونية، ساعد النموذج منصة على توليد صور متعددة للمنتجات تتنوع بين الألوان والأنماط، مما رفع معدلات التحويل بنسبة 34%، بينما في صناعة الألعاب، استُخدم لإنشاء آلاف صور للشخصيات غير القابلة للعب بتكلفة منخفضة جدًا مقارنة بالطرق التقليدية. وفي القطاع الهندسي، ساهم في إنتاج نماذج داخلية للمباني مما وفر وقتًا وجهدًا خلال مراحلة مراجعة المشاريع مع العملاء.

القطاع التطبيق التأثير
التجارة الإلكترونية توليد صور منتجات متنوعة زيادة معدلات التحويل 34%
صناعة الألعاب إنشاء شخصيات غير قابلة للعب خفض التكلفة بشكل كبير
الهندسة المعمارية نماذج داخلية للمباني توفير الوقت والجهد
  • تجربة النموذج محدود للأشخاص المختارين أو عبر منصات مثل LMArena في وضع المعركة
  • استخدامه خلف الكواليس في بعض منصات مثل Flux AI

حاليًا، لا يتوفر نموذج «نانو بنانا» لتجربة عامة على نطاق واسع، ويقتصر الوصول عليه على المستخدمين المحظوظين، إلا أنه يشكل خطوة هائلة نحو دمج الذكاء الاصطناعي في عمليات التحرير الإبداعي، محققًا تفوقًا قد يؤثر على أدوات تصميم شهيرة مثل فوتوشوب وكانفا، مقدمًا بذلك مستقبلًا جديدًا في مجال التصميم الرقمي والميديا التوليدية.