Anthropic запустили Code Review с агентами для каждого PR

Главное:

Anthropic запустила автоматизированный сервис Code Review с использованием команды ИИ-агентов для проверки каждого pull request.
Система увеличила долю содержательных комментариев с 16% до 54% и выявляет баги даже в стороннем коде, не затронутом в PR.
Услуга доступна в режиме research preview для планов Team и Enterprise и стоит от 15 до 25 долларов за ревью в зависимости от размера PR.

Компания Anthropic представила инновационное решение для автоматизированного ревью кода — сервис Code Review, функционирующий на основе команды ИИ-агентов. Каждый раз при создании pull request система запускает параллельную проверку, в ходе которой агенты обнаруживают ошибки, фильтруют ложные срабатывания и классифицируют проблемы по уровню серьёзности. Итогом работы становится один общий комментарий к PR и серия детализированных инлайн-замечаний. Среднее время обработки составляет около 20 минут.

Внедрение автоматизированного ревью в рабочий процесс Anthropic привело к заметному повышению качества обратной связи: содержательные комментарии стали появляться в 54% PR вместо прежних 16%. Особенно эффективно система проявляет себя при анализе крупных pull request — от 1000 строк, где выявляется до 7,5 проблем в среднем, а баги обнаруживаются в 84% случаев. При этом менее 1% комментариев признаны разработчиками ошибочными.

Практические примеры работы системы впечатляют. Например, однострочное изменение в продакшн-сервисе, которое на первый взгляд казалось безопасным, было ранжировано как критическое: ИИ-агенты выявили потенциальную ошибку, способную нарушить работу аутентификации, что позволило предотвратить серьёзный сбой до слияния кода. Ещё один кейс — в open-source проекте TrueNAS, где агенты обнаружили баг в коде, не затронутом самим PR: неожиданное несовпадение типов вызывало ошибочное сбрасывание кеша ключей шифрования при синхронизации.

Услуга Code Review доступна в формате research preview для пользователей с планами Team и Enterprise и предполагает плату в диапазоне 15–25 долларов за одно ревью в зависимости от размеров пулл-реквеста. Это решение является более дорогим по сравнению с бесплатным и открытым GitHub Action от Anthropic, однако демонстрирует значительно более глубокий и точный анализ кода.

Внедрение такого инструмента подчеркивает растущую роль искусственного интеллекта в сфере разработки программного обеспечения, предоставляя командам эффективные средства повышения качества и надежности кода.

Anthropic запустили Code Review с агентами для каждого PR

Как стать IT-тренером без технического образования: план карьеры

Навыки технического писателя: компетенции для успешного старта

Как стать техническим писателем без опыта в IT: пошаговый план смены карьеры

Топ-навыки Customer Success Manager: какие компетенции развивать для успешного трудоустройства

Как стать Customer Success Manager без опыта: пошаговый план смены профессии

ИИ в прогнозировании энергопотребления: точность и экономия

Как создать и обучить модель для обработки изображений

Искусственный интеллект в раннем предупреждении экономических кризисов

Искусственный интеллект в профилактической медицине

Обучение с ограничениями: внедрение правил в нейронные сети

Читайте также