Вышла Gemini 3.1 Flash-Lite — в 3-4 раза дешевле и быстрее Claude 4.5 Haiku

Главное:

Компания Google представила новую модель искусственного интеллекта Gemini 3.1 Flash-Lite — сверхбыструю и бюджетную версию в линейке Gemini 3.
Стоимость обработки текста составляет $0,25 за миллион входных токенов и $1,50 за миллион выходных, что значительно дешевле конкурентов Claude 4.5 Haiku и GPT-5 mini.
Модель демонстрирует высокую скорость генерации — 363 токена в секунду, а также лучше справляется с задачами научных рассуждений, мультимодального понимания и генерации кода.

Google официально представил новую модель искусственного интеллекта Gemini 3.1 Flash-Lite, которая стала самой доступной и быстрой среди продуктов линейки Gemini 3. Её стоимость значительно ниже конкурентов: $0,25 за миллион входных токенов и $1,50 за миллион выходных. Для сравнении, цены у конкурирующих моделей Claude 4.5 Haiku и GPT-5 mini составляют $1,00/$5,00 и $0,25/$2,00 соответственно.

Помимо привлекательной стоимости, модель выделяется высокой производительностью скорости генерации текста — 363 токена в секунду, что почти в три раза быстрее Claude 4.5 Haiku (108 токенов) и более чем в пять раз GPT-5 mini (71 токен). Время до первого токена у Flash-Lite в 2,5 раза меньше, чем у предыдущей версии Gemini 2.5 Flash, что улучшает отклик системы. Такие показатели были подтверждены в независимом бенчмарке Artificial Analysis.

Кроме скорости, важно отметить качество работы модели: на тестах научных рассуждений GPQA Diamond Gemini 3.1 Flash-Lite набрала 86,9%, превзойдя Claude 4.5 Haiku с 73% и GPT-5 mini с 82,3%. В мультимодальном понимании (тест MMMU Pro) новая модель достигла 76,8%, значительно опередив Claude 4.5 Haiku с 58%. Значительные успехи показаны и в сфере генерации кода — на тесте LiveCodeBench Flash-Lite получила 72%, что выше результатов Claude 4.5 Haiku в 53,2% и почти вдвое превосходит предыдущую Gemini 2.5 Flash-Lite (34,3%).

Flash-Lite поддерживает различные уровни глубины «мышления», позволяя адаптировать работу ИИ под задачи от простых классификаций до сложных симуляций. Такая гибкость открывает широкие возможности для применения в коммерческих и исследовательских проектах. Уже сейчас модель используется в раннем доступе компаниями Latitude, Cartwheel и Whering.

Презентация Flash-Lite продолжает стратегию Google по агрессивному снижению цен на технологии ИИ: если более мощные версии Gemini 3 Flash и 3 Pro оцениваются в $0,50/$3,00 и $2,00/$12,00 соответственно, то новая модель обещает стать экономически эффективным инструментом для масштабного использования в массовых конвейерах, где стоимость каждого токена критична.