- OpenAI выпустила GPT-5.1-Codex-Max — специализированную модель для программирования в рамках Codex-агента.
- Модель демонстрирует лучшие результаты в бенчмарках по программированию, опережая конкурентов Google Gemini 3 Pro и Claude Sonnet 4.5.
- GPT-5.1-Codex-Max оснащена технологией compaction для работы с большими контекстами и эффективна по затратам токенов и времени.
Компания OpenAI анонсировала новую версию языковой модели GPT-5.1-Codex-Max, ориентированную на задачи программирования внутри кодинг-агента Codex. Модель уже внедряется во всех вариантах Codex для пользователей планов ChatGPT Plus, Pro, Edu и Enterprise, а ожидаемый релиз для API запланирован на более поздний срок.
Новый релиз является ответом OpenAI на запуск конкурирующего продукта Google Gemini 3 Pro. По результатам внутренних тестов, GPT-5.1-Codex-Max превзошла конкурентов в ряде ключевых бенчмарков, в частности, в SWE-Bench Verified — одном из главнейших тестов по программированию. Модель показала результат 77,2%, опередив Google Gemini 3 Pro (76,2%) и Claude Sonnet 4.5.
Отмечается также, что при различных настройках производительности — low, medium и high — GPT-5.1-Codex-Max работает быстрее и требует меньше токенов, чем предшествующая версия GPT-5.1-Codex, что указывает на более экономное использование ресурсов. Для достижения максимальной точности предусмотрена дополнительная настройка xhigh. По информации разработчиков, модель способна выполнять задачи продолжительностью до 24 часов без необходимости вмешательства.
Примечательной особенностью GPT-5.1-Codex-Max стала нативная поддержка механизма compaction, позволяющего эффективно работать с несколькими контекстными окнами. Такая технология «уплотняет» историю общения, выделяя главное и позволяя обрабатывать миллионы токенов в рамках одной задачи — что значительно расширяет возможности модели при сложных и продолжительных сценариях программирования.
В целом, выход GPT-5.1-Codex-Max знаменует очередной шаг OpenAI в развитии ИИ для программирования, предоставляя разработчикам мощный и гибкий инструмент, способный конкурировать с лучшими продуктами на рынке.
