- Black Forest Labs представила семейство моделей FLUX.2 для генерации изображений с открытыми весами.
- Модель сочетает Vision-Language модуль Mistral-3 на 24 млрд параметров и трансформер с архитектурой Rectified Flow, что улучшает качество и контекст изображения.
- FLUX.2 обеспечивает высокое разрешение, поддержку до 10 входных изображений и конкурентоспособна с Nano Banana при более низкой стоимости генерации.
Компания Black Forest Labs анонсировала новое семейство моделей генерации изображений FLUX.2, которое позиционируется как конкурент Google Nano Banana и выделяется наличием версии с открытыми весами. Основой системы служит связка двух компонентов: сначала Vision-Language модель Mistral-3 с 24 миллиардами параметров формирует логически связную сцену, после чего трансформер с архитектурой Rectified Flow выполняет финальную визуализацию. Такой подход позволяет модели лучше «понимать» физику света, перспективу и взаимное расположение объектов в пространстве.
Одной из особенностей FLUX.2 является возможность принимать до десяти исходных изображений. Это обеспечивает стабильное сохранение важных деталей, таких как особенности лица персонажа, фирменный стиль или дизайн товара, в множестве сгенерированных вариантов без необходимости дополнительной настройки. Модели поддерживают разрешение до 4 мегапикселей, различные соотношения сторон, а также корректно отображают текст и интерфейсные элементы.
Линейка FLUX.2 включает несколько версий: наиболее мощные [pro] и [flex], а также облегчённую для локального запуска FLUX.2 [dev]. Несмотря на высокую мощность, последняя версия требует порядка 90 ГБ видеопамяти в стоковом варианте, однако совместные усилия NVIDIA и Black Forest Labs по внедрению FP8-квантизаций позволяют снизить это значение примерно на 40%. Благодаря этому запуск FLUX.2 [dev] становится возможным на современных видеокартах серии RTX 4090 и 5090. Поддержка моделей уже интегрируется в популярные инструменты ComfyUI и Diffusers.
В сравнении с конкурентами, такими как Seed Dream 4 и Nano Banana, FLUX.2 демонстрирует превосходство по качеству и экономичности генерации, уступая лишь топовой версии Nano Banana Pro. Таким образом, FLUX.2 представляет собой технологически продвинутую и доступную платформу для создания высококачественных изображений и может заинтересовать широкий круг пользователей, от исследователей до профессионалов в области искусственного интеллекта и визуального контента.
