Google представила Gemini 3 Deep Think, опередившую GPT-5.1 в тестах Обложка: Skyread

Google представила Gemini 3 Deep Think, опередившую GPT-5.1 в тестах

Новости
Главное:

  • Google представила режим Deep Think для модели Gemini 3, который значительно превосходит GPT-5.1 по тестам абстрактного мышления.
  • Режим Deep Think применяет параллельное рассуждение, одновременно исследуя несколько гипотез и выбирая оптимальное решение.
  • Использование мультиагентного подхода ведёт к увеличению вычислительных затрат и обусловливает высокую стоимость доступа — $250 в месяц.

Компания Google расширила функциональность своей модели искусственного интеллекта Gemini 3, выпустив режим Deep Think, ориентированный на решение сложных задач в областях математики, науки и логики. Отличительной особенностью нового режима является применение параллельного рассуждения: несколько экземпляров модели Gemini 3 Pro одновременно формируют различные гипотезы, а специальный арбитр выбирает наиболее подходящий ответ.

На специализированном бенчмарке ARC-AGI-2, который проверяет умение решать незнакомые абстрактные задачи, Deep Think оказался практически в три раза эффективнее своего конкурента GPT-5.1, набрав 45,1% против 17,6%. Стандартная версия Gemini 3 Pro в этом же тесте продемонстрировала результат 31,1%.

Другие тесты подтверждают преимущество нового режима. Например, в экзамене Humanity’s Last Exam, ориентированном на академические знания по математике, естественным наукам и гуманитарным дисциплинам, Deep Think показал 41%, в то время как GPT-5.1 достиг 26,5%. В тесте GPQA Diamond Deep Think достиг 93,8%, что также превосходит 88,1% у GPT-5.1.

Примечательно, что архитектура режима Deep Think не раскрывается полностью представителями Google, однако известно, что за процесс решения задач отвечают несколько экземпляров Gemini 3 Pro, а итоговый ответ формирует отдельная модель-арбитр. Такой мультиагентный подход позволяет повысить качество вывода, но при этом значительно увеличивает время генерации ответа — до нескольких минут по сравнению с обычными секундами.

Высокая вычислительная сложность нового режима отражается и на стоимости доступа: Deep Think доступен по подписке Google AI Ultra за $250 в месяц. Следует отметить, что подобный мультиагентный метод становится трендом в индустрии — компания OpenAI применяла похожие технологии для своих достижений на Международной математической олимпиаде, а xAI запустила модель Grok 4 Heavy с аналогичной архитектурой.

Инициатива Google с Deep Think подтверждает стремление индустрии к созданию более глубоких и комплексных моделей, способных решать сложные интеллектуальные задачи, однако она также подчёркивает возросшие требования к вычислительным ресурсам и связанным с ними затратам. В перспективе развитие подобных технологий будет зависеть от оптимизации ресурсов и баланса между качеством и эффективностью работы искусственного интеллекта.

Tagged