- Google выпустила финальную версию модели создания изображений Gemini 2.5 Flash Image под кодовым названием Nano Banana.
- Добавлена поддержка 10 различных форматов вывода, включая ландшафтные, квадратные, портретные и гибкие пропорции.
- Появилась возможность получать только изображение без сопроводительного текста, что позволяет экономить токены при работе через API.
Компания Google объявила о переходе модели генерации изображений Gemini 2.5 Flash Image, известной также как Nano Banana, в статус General Availability — финальной и стабильной версии продукта. В новой редакции были устранены различные мелкие ошибки и улучшена производительность. Кроме того, разработчиками добавлены новые функциональные возможности, которые расширяют варианты использования технологии для конечных пользователей и корпоративных клиентов.
Одним из ключевых улучшений стала поддержка десяти форматов вывода изображений. В их числе представлены ландшафтные пропорции 21:9, 16:9, 4:3 и 3:2, квадратный формат 1:1, портретные варианты 9:16, 3:4 и 2:3, а также гибкие форматы 5:4 и 4:5. Это новшество позволяет создавать визуальный контент, более точно соответствующий различным требованиям и сценариям применения, включая социальные сети, профессиональную графику и мультимедийные проекты.
Ещё одним важным нововведением является возможность настройки модели так, чтобы в ответе API возвращалось исключительно изображение без дополнительного сопроводительного текста. Такая опция особенно полезна для разработчиков, стремящихся оптимизировать расход токенов и повысить эффективность работы с платформой.
Финальная версия Google Nano Banana уже доступна в таких продуктах Google, как Gemini App, Google AI Studio и Vertex AI, предназначенных для корпоративного сегмента. В то же время использование модели через API оценивается в $0,039 за одно сгенерированное изображение, что ставит продукт в конкурентоспособную ценовую категорию среди аналогичных решений на рынке.
Таким образом, Google продолжает совершенствовать свои инструменты для создания визуального контента с помощью искусственного интеллекта, расширяя функциональность и удобство работы для разработчиков и корпоративных клиентов.