- Anthropic запустила автоматизированный сервис Code Review с использованием команды ИИ-агентов для проверки каждого pull request.
- Система увеличила долю содержательных комментариев с 16% до 54% и выявляет баги даже в стороннем коде, не затронутом в PR.
- Услуга доступна в режиме research preview для планов Team и Enterprise и стоит от 15 до 25 долларов за ревью в зависимости от размера PR.
Компания Anthropic представила инновационное решение для автоматизированного ревью кода — сервис Code Review, функционирующий на основе команды ИИ-агентов. Каждый раз при создании pull request система запускает параллельную проверку, в ходе которой агенты обнаруживают ошибки, фильтруют ложные срабатывания и классифицируют проблемы по уровню серьёзности. Итогом работы становится один общий комментарий к PR и серия детализированных инлайн-замечаний. Среднее время обработки составляет около 20 минут.
Внедрение автоматизированного ревью в рабочий процесс Anthropic привело к заметному повышению качества обратной связи: содержательные комментарии стали появляться в 54% PR вместо прежних 16%. Особенно эффективно система проявляет себя при анализе крупных pull request — от 1000 строк, где выявляется до 7,5 проблем в среднем, а баги обнаруживаются в 84% случаев. При этом менее 1% комментариев признаны разработчиками ошибочными.
Практические примеры работы системы впечатляют. Например, однострочное изменение в продакшн-сервисе, которое на первый взгляд казалось безопасным, было ранжировано как критическое: ИИ-агенты выявили потенциальную ошибку, способную нарушить работу аутентификации, что позволило предотвратить серьёзный сбой до слияния кода. Ещё один кейс — в open-source проекте TrueNAS, где агенты обнаружили баг в коде, не затронутом самим PR: неожиданное несовпадение типов вызывало ошибочное сбрасывание кеша ключей шифрования при синхронизации.
Услуга Code Review доступна в формате research preview для пользователей с планами Team и Enterprise и предполагает плату в диапазоне 15–25 долларов за одно ревью в зависимости от размеров пулл-реквеста. Это решение является более дорогим по сравнению с бесплатным и открытым GitHub Action от Anthropic, однако демонстрирует значительно более глубокий и точный анализ кода.
Внедрение такого инструмента подчеркивает растущую роль искусственного интеллекта в сфере разработки программного обеспечения, предоставляя командам эффективные средства повышения качества и надежности кода.
