Вышла GPT-5.3-Codex — модель, участвовавшая в своём создании

Главное:

OpenAI выпустила GPT-5.3-Codex — модель, которая участвовала в собственной разработке, помогая с дебагом и деплоем.
Модель демонстрирует значительный прогресс в смежных задачах управления компьютером и стала универсальным агентом для профессиональных рабочих процессов.
GPT-5.3-Codex получила высокий рейтинг по кибербезопасности и обучалась выявлять уязвимости в коде, при этом доступ к ней открыт платным подписчикам ChatGPT.

Компания OpenAI представила новую версию своей модели Codex — GPT-5.3-Codex, которая стала ключевым обновлением в линейке моделей для программирования и автоматизации рабочих процессов. Особенностью релиза стало то, что сама модель принимала активное участие в процессе своего создания, выполняя задачи по отладке кода, управлению развёртыванием и анализу результатов обучения. По утверждениям разработчиков, это значительно ускорило цикл разработки и улучшило качество финального продукта.

По результатам тестирования, GPT-5.3-Codex демонстрирует умеренный рост эффективности в программировании: её точность на бенчмарке SWE-Bench Pro повысилась с 56,4% до 56,8%. Однако более заметные успехи модель показала в смежных областях. Так, на Terminal-Bench 2.0 результат вырос с 64% до 77,3%, а на тесте OSWorld-Verified, где агент управляет компьютером через визуальный интерфейс, показатель увеличился с 38,2% до 64,7%. Для сравнения, средний уровень человека на этом же тесте составляет около 72%. Кроме того, GPT-5.3-Codex стала работать на 25% быстрее и использует меньше токенов, что повышает общую эффективность взаимодействия.

Главная инновация новой модели — выход за рамки только программирования. OpenAI позиционирует GPT-5.3-Codex как универсального помощника для самых разных профессиональных задач на компьютере, включая создание презентаций, анализ таблиц, написание документации и управление десктопными приложениями. На бенчмарке GDPval, оценивающем выполнение рабочих процессов в 44 разных профессиях, модель достигла результата в 70,9%, что сравнимо с предыдущей версией GPT-5.2. Также внедрён интерактивный режим работы, позволяющий агенту регулярно отчитываться о прогрессе и принимать корректировки от пользователя в реальном времени.

Отдельное внимание уделено кибербезопасности. GPT-5.3-Codex стала первой моделью OpenAI, получившей высокий рейтинг (High) в рамках внутреннего Preparedness Framework, и специально обученной выявлять уязвимости в программном коде. Для дальнейшего развития и тестирования этой направленности компания запустила пилотный проект Trusted Access for Cyber, а также выделила $10 млн в виде API-кредитов на поддержку защиты открытого программного обеспечения и критической инфраструктуры.

Доступ к модели предоставлен подписчикам платного сервиса ChatGPT, при этом открытие API для широкой аудитории ожидается в будущем. Все эти инновации свидетельствуют о том, что OpenAI активно движется к созданию универсальных интеллектуальных агентов, способных комплексно автоматизировать широкий спектр задач профессиональной деятельности.