- Искусственный интеллект Claude Sonnet 4.5 способен работать непрерывно до 30 часов, что в четыре раза превышает предыдущий рекорд Anthropic.
- Внутренний тест показал, что Claude Sonnet 4.5 самостоятельно создал чат-приложение уровня Slack/Teams, написав 11 тысяч строк кода.
- Технические улучшения включают динамическое редактирование контекста, отдельный модуль памяти и устойчивые циклы планирования, действий и проверки.
Компания Anthropic представила обновлённую версию своего искусственного интеллекта — Claude Sonnet 4.5, который по ряду показателей превзошёл своих предшественников и конкурентов в области программирования. Главным достижением нового ИИ стала способность к длительной автономной работе: в одном из внутренних испытаний модель смогла непрерывно программировать около 30 часов, что примерно в четыре раза превышает предыдущий рекорд компании.
В ходе теста Claude Sonnet 4.5 самостоятельно разработал чат-приложение с функционалом уровня современных корпоративных мессенджеров, таких как Slack или Teams. За это время ИИ написал около 11 тысяч строк кода и довёл проект до завершения без вмешательства человека.
Кроме написания кода, ИИ выполнял комплексные задачи, включая развертывание служб баз данных, покупку доменных имён и прохождение аудитов соответствия стандарту SOC 2. Пользователи, принимавшие участие в бета-тесте, высоко оценили способности Claude Sonnet 4.5 в решении долгосрочных и сложных технических задач, включая внесение инженерных правок и разработку новых продуктовых функций.
Эксперт Anthropic Дэвид Херши и аналитик Рохан Паул выделяют несколько ключевых технических нововведений, позволивших добиться столь впечатляющей продолжительности работы. Среди них — возможность редактирования контекста в реальном времени, отдельное модульное хранилище рабочих заметок вне основного окна диалога, а также контрольные точки автономной работы с возможностью отката. Кроме того, улучшены циклы «планирование → действие → проверка», что повышает устойчивость и эффективность сессий.
Особое значение имеет повышение надёжности в использовании системы на уровне операционной системы (OSWorld оценён в 61,4%), что обеспечивает автоматическое восстановление после сбоев и продолжение работы без вмешательства оператора. Также запуск ИИ происходит в управляемых облачных средах с изоляцией и мониторингом, что позволяет применять данную технологию в реальных корпоративных условиях при длительных вычислительных задачах.
Для сравнения, предыдущий рекорд непрерывной работы ИИ Anthropic составлял около 7 часов, схожий по длительности уровень демонстрировали и конкуренты, включая OpenAI с моделью GPT-5-Codex. Таким образом, Claude Sonnet 4.5 задаёт новый стандарт автономного программирования, открывая новые возможности для автоматизации и масштабных проектов в области разработки программного обеспечения.