Gemini 3.0 Pro продемонстрировала значительный рост в бенчмарках Обложка: Skyread

Gemini 3.0 Pro продемонстрировала значительный рост в бенчмарках

Новости
Главное:

  • Новая модель Gemini 3.0 Pro значительно превзошла GPT-5.1 Thinking по большинству бенчмарков.
  • Gemini 3.0 Pro продемонстрировала выдающиеся результаты в тестах на математику, понимание интерфейсов и сложные академические вопросы.
  • Запуск Gemini 3.0 Pro запланирован на ближайшие часы с интеграцией в несколько платформ Google.

Недавние результаты бенчмарков показывают, что модель Gemini 3.0 Pro заметно опережает предшествующий лидер — GPT-5.1 Thinking. В рейтинге, где GPT-5.1 Thinking получила 17,6%, Gemini 3.0 Pro набрала внушительные 31,1%, что почти вдвое превышает показатель конкурента. Несмотря на прогресс, обе модели пока ещё далеки от человеческого уровня, который оценивается в 66%.

Особенно впечатляющим стало выступление Gemini 3.0 Pro в эксклюзивных тестах. В MathArena Apex — тесте, ориентированном на математические задачи экстремальной сложности — новинка достигла 23,4%, тогда как остальные модели едва перевалили за 1,6%. В тесте ScreenSpot-Pro, который оценивает способность понимать интерфейсы и потенциально важен для агентских функций, Gemini 3.0 Pro показала 72,7%, значительно превзойдя конкурентов.

Не менее важно и достижение в области академических знаний. В тесте Humanity’s Last Exam на сложные вопросы Gemini 3.0 Pro набрала 37,5%, оставив позади лидировавшую ранее GPT-5.1 Thinking с ее 26,5%. При этом в большинстве других бенчмарков модель также занимает первые места, хоть и с меньшим преимуществом.

Официальный запуск Gemini 3.0 Pro ожидается в ближайшие часы, модель будет доступна сразу на нескольких платформах Google: Gemini App, Vertex AI, Google AI Studio и Google API. Ожидается, что новые тесты и реальные примеры использования позволят лучше оценить потенциал этой передовой системы искусственного интеллекта.

Tagged