- JetBrains разработали собственный CLI-агент Junie, предназначенный для работы в терминальном окружении.
- Junie занял первое место в бенчмарке Terminal-Bench 2.0, опередив более известные решения.
- Terminal-Bench оценивает инженерные способности агентов выполнять задачи в реальных условиях терминала, включая запуск команд, отладку и настройку среды.
JetBrains, весьма известная своими мощными инструментами для разработчиков, тихо внедрила собственное решение для командной строки — агент Junie CLI. Этот инструмент не был широко анонсирован, однако в недавно опубликованном рейтинге Terminal-Bench 2.0 именно Junie одержал уверенную победу, опередив множество конкурентов.
Terminal-Bench — это специализированный бенчмарк, который фокусируется на оценке практических навыков агентов при работе в терминальном окружении. В отличие от традиционных тестов, где проверяется способность рассуждать на абстрактных задачах, данный тест требует от агента эффективно взаимодействовать с реальной средой: запускать и корректно применять shell-команды, писать и отлаживать скрипты, устанавливать необходимые зависимости и устранять ошибки с реальной инфраструктурой. Таким образом, основной критерий оценки — успешное последовательное выполнение инженерных заданий, позволяющее добиться воспроизводимых и работоспособных результатов.
Победа Junie в Terminal-Bench демонстрирует высокую инженерную компетентность решения JetBrains, что может значительно повысить эффективность разработки и интеграции инструментов в терминальных сценариях. Наличие такого агента расширит возможности разработчиков по автоматизации и ускорению типовых задач, связанных с обслуживанием и настройкой рабочих окружений прямо из командной строки.
Несмотря на отсутствие громких публичных анонсов, Junie заслуженно привлек внимание профессионального сообщества, показав новый этап развития интеллектуальных ассистентов в терминале, где на первом месте стоит практическое применение навыков и надежность.
