OpenAI анонсировала GPT-5.2 с фокусом на автоматизацию и агенты

Главное:

OpenAI представила новую версию модели GPT-5.2, ориентированную на сложные профессиональные задачи и длительные агентные сценарии.
GPT-5.2 демонстрирует заметный прогресс в реальной разработке кода и работе с длинными контекстами до 256 тысяч токенов.
Улучшена точность использования инструментов агентами, а также способность модели анализировать изображения и сложные интерфейсы.

Компания OpenAI анонсировала выпуск новой фронтир-модели GPT-5.2, которая позиционируется как мощный инструмент для решения сложных профессиональных задач, связанных с программированием, многозадачностью и мультимодальными сценариями. В обновлении акцент сделан на улучшенную поддержку длительных контекстов, повышенную точность работы с инструментами и развитие полного цикла кодогенерации.

Важным достижением GPT-5.2 стал значительный рывок в реальных инженерных задачах. В одном из наиболее сложных тестов по программированию SWE-Bench Pro модель показала 55,6% правильно решённых заданий, превзойдя GPT-5.1 с показателем 50,8%. На более упрощённом SWE-Bench Verified достигнута точность 80%. Такой прогресс свидетельствует о сокращении необходимости ручной доработки кода и уверенном продвижении модели от вспомогательного помощника к самостоятельному инструменту, способному закрывать новые функции и исправлять баги практически без вмешательства человека. Особо отмечено качественное улучшение в области фронтенда — генерация сложных интерфейсов, 3D-элементов и UI при помощи одного крупного запроса теперь выглядит как полноценный комплексный инструмент для full-stack разработки.

Одно из ключевых отличий GPT-5.2 — работа с длинным контекстом размером до 256 тысяч токенов. Анализ на тестовом наборе MRCRv2 показал высокую точность извлечения информации даже из огромных объёмов данных. Практическая польза заключается в возможности эффективно обрабатывать большие договоры, проекты из множества файлов, объёмные отчёты и длинные переписки без потери связности и консистентности ответов. Новый compact-режим дополнительно позволяет модели «думать» за пределами текущего окна, что особенно важно для длительных агентных сценариев и комплексной автоматизации.

В части интеграции с внешними инструментами GPT-5.2 достигла впечатляющего результата 98,7% успешного использования тулзов на бенчмарке Tau2-bench Telecom. Это позволяет компаниям интегрировать несколько отдельных агентов в один «мега-агент» с поддержкой более 20 инструментов, существенно упрощая архитектуру и повышая надёжность решений. Кроме того, даже при минимальном уровне усилий reasoning.effort=’none’ точность осталась высокой.

Модель также улучшила способность обрабатывать визуальный контент — графики, дашборды, пользовательские интерфейсы и технические схемы. Ошибок при интерпретации GUI стало вдвое меньше, что положительно сказывается на аналитике, создании резюме документов и деловой переписке. Отмечено сокращение числа фактических ошибок (галлюцинаций) примерно на треть, что значительно повышает надёжность и качество результатов.

GPT-5.2 уже доступна для подписчиков ChatGPT Plus, Pro, Business и Enterprise и через API под версиями gpt-5.2 и gpt-5.2-chat-latest, а также в расширенной gpt-5.2-pro. Стоимость использования в API выше по сравнению с GPT-5.1 и составляет 1,75 $ за миллион входных токенов и 14 $ за миллион выходных, однако благодаря оптимизации итоговое потребление токенов снижается за счёт более коротких и эффективных ответов.

В целом, GPT-5.2 подтверждает тенденцию к трансформации больших языковых моделей из вспомогательных ассистентов в полноценные инструменты профессиональной автоматизации с возможностью масштабного применения в разработке программного обеспечения и бизнес-процессах.