- Новая модель Gemini 3.0 Pro значительно превзошла GPT-5.1 Thinking по большинству бенчмарков.
- Gemini 3.0 Pro продемонстрировала выдающиеся результаты в тестах на математику, понимание интерфейсов и сложные академические вопросы.
- Запуск Gemini 3.0 Pro запланирован на ближайшие часы с интеграцией в несколько платформ Google.
Недавние результаты бенчмарков показывают, что модель Gemini 3.0 Pro заметно опережает предшествующий лидер — GPT-5.1 Thinking. В рейтинге, где GPT-5.1 Thinking получила 17,6%, Gemini 3.0 Pro набрала внушительные 31,1%, что почти вдвое превышает показатель конкурента. Несмотря на прогресс, обе модели пока ещё далеки от человеческого уровня, который оценивается в 66%.
Особенно впечатляющим стало выступление Gemini 3.0 Pro в эксклюзивных тестах. В MathArena Apex — тесте, ориентированном на математические задачи экстремальной сложности — новинка достигла 23,4%, тогда как остальные модели едва перевалили за 1,6%. В тесте ScreenSpot-Pro, который оценивает способность понимать интерфейсы и потенциально важен для агентских функций, Gemini 3.0 Pro показала 72,7%, значительно превзойдя конкурентов.
Не менее важно и достижение в области академических знаний. В тесте Humanity’s Last Exam на сложные вопросы Gemini 3.0 Pro набрала 37,5%, оставив позади лидировавшую ранее GPT-5.1 Thinking с ее 26,5%. При этом в большинстве других бенчмарков модель также занимает первые места, хоть и с меньшим преимуществом.
Официальный запуск Gemini 3.0 Pro ожидается в ближайшие часы, модель будет доступна сразу на нескольких платформах Google: Gemini App, Vertex AI, Google AI Studio и Google API. Ожидается, что новые тесты и реальные примеры использования позволят лучше оценить потенциал этой передовой системы искусственного интеллекта.
