GPT-5.3-Codex создала себя и получила рейтинг «высокой киберугрозы»

Главное:

OpenAI выпустила GPT-5.3-Codex — первую модель, которая помогала создавать саму себя, участвуя в отладке тренинга, деплое и анализе тестов.
Модель демонстрирует значительный прирост производительности и качества: быстрее предшественницы на 25% и лучшие результаты на бенчмарках SWE-Bench Pro, Terminal-Bench 2.0 и OSWorld.
GPT-5.3-Codex получила рейтинг «высокой киберугрозы» из-за потенциальной способности помогать в кибератаках, поэтому доступ к продвинутым функциям строго ограничен для проверенных специалистов.

Компания OpenAI представила новую версию своей модели искусственного интеллекта — GPT-5.3-Codex. Особенность этого релиза заключается в том, что модель оказала активное участие в собственном создании — она сама управляла процессом отладки тренинга, деплоем и даже анализом результатов тестирования. Такой подход значительно ускорил разработку, что отметила сама команда OpenAI.

По сравнению с предыдущей версией, GPT-5.3-Codex работает на 25% быстрее и демонстрирует лучшие результаты на ключевых отраслевых бенчмарках. Например, на SWE-Bench Pro, включающем четыре языка программирования и устойчивом к утечкам данных, модель набрала 56,8%. На Terminal-Bench 2.0, проверяющем навыки работы в командной строке, показатель составил 77,3% против 64% у предшественника. Кроме того, на тестах OSWorld, где задачи выполняются в визуальном интерфейсе рабочего стола, GPT-5.3-Codex практически достигла уровня человека: 64,7% против примерно 72%.

Однако повышение мощности и возможностей вызвало и серьёзные опасения в области кибербезопасности. Модель впервые получила внутрикорпоративный рейтинг «High» по системе оценки рисков Preparedness Framework, что указывает на её потенциальную способность автоматизировать и способствовать проведению реальных кибератак. В связи с этим OpenAI приняла решение ограничить открытый доступ к API, внедрив самый полный на сегодняшний день стек защиты от киберугроз. Доступ к возможностям модели в сфере безопасности теперь предоставляется лишь проверенным экспертам в рамках программы Trusted Access for Cyber.

Параллельно компания развивает закрытое бета-тестирование собственного ИИ-агента для поиска уязвимостей Aardvark и выделяет 10 миллионов долларов в виде кредитов API для исследователей, занимающихся защитой открытого программного обеспечения и критически важной инфраструктуры.

Релиз GPT-5.3-Codex состоялся 5 февраля, в тот же день, когда конкурирующая компания Anthropic представила Claude Opus 4.6. В то время как внимание индустрии традиционно привлекают бенчмарки, главная интрига нового релиза GPT-5.3-Codex заключается в том, что подобная модель показывает путь к частичной автоматизации собственного развития. Это поднимает важный вопрос о том, насколько скоро искусственный интеллект сможет создавать и совершенствовать себя практически без человеческого вмешательства.