GPT-5.2 Pro признан лучшим ИИ для решения сложной математики

Главное:

GPT-5.2 Pro от OpenAI заняла первое место в сложнейшей категории бенчмарка FrontierMath с результатом 29.2%.
GPT-5.2 Pro значительно опередила конкурентов, включая Google Gemini 3 Pro и Anthropic Claude Opus 4.5.
Стоимость доступа к GPT-5.2 Pro через API высокая — $21 за миллион входных и $168 за миллион выходных токенов.

Год назад лучшие языковые модели решали около 2% задач сложного математического бенчмарка FrontierMath, который включает сотни оригинальных задач высочайшей сложности, разработанных и проверенных профессиональными математиками. FrontierMath разделён на четыре категории, причём Tier 4 объединяет 50 наиболее сложных задач из таких областей, как теория чисел, алгебраическая геометрия и теория категорий. Решение каждой такой задачи требует от исследователей часов и даже дней.

30 декабря 2025 года OpenAI представила GPT-5.2 Pro, которая продемонстрировала впечатляющие результаты, став лидером в самой сложной категории Tier 4 с показателем 29.2%. Предыдущий лидер – модель Gemini 3 Pro Preview от Google – набрал 18.8%. Кроме того, на базовых уровнях задач (Tier 1—3) модели OpenAI также обошли конкурентов: GPT-5.2 Thinking достигла 40.7%, а Gemini 3 Pro – 37.6%.

Отрыв GPT-5.2 Pro от остальных игроков на рынке заметен и в самой жёсткой конкуренции. Например, Anthropic Claude Opus 4.5 решает лишь 4.2% задач из Tier 4, что соответствует 2 из 48 приватных задач, и около 21% на более простых уровнях. Значительным фактором является и стоимость доступа: OpenAI взимает $21 за миллион входных токенов и $168 за миллион выходных, что ставит GPT-5.2 Pro среди самых дорогих ИИ-моделей.

Прогресс в решении математических проблем с помощью таких моделей уже выходит за рамки тестов. Исследователи Марк Селке и Стивен Ин в недавней публикации доказали теорему в статистической теории обучения, используя варианты GPT-5.2 Pro. Люди в этом процессе лишь формулировали задачи и проверяли полученные результаты. Дискуссии в научных и инженерных сообществах, в том числе на Reddit, отражают ожидания появления «сверхчеловеческого математика» уже к середине 2026 года.

Таким образом, GPT-5.2 Pro демонстрирует не просто постепенный рост, а значительный шаг в способности ИИ решать сложнейшие математические задачи, что открывает новые перспективы для автоматизации научных исследований в области математики и смежных дисциплин.