xAI представила достижения Grok 4.1 Fast и раскрыла детали Agent Tools API

Главное:

Модель Grok 4.1 Fast от xAI продемонстрировала лучшие результаты в ряде бенчмарков, включая 100% в τ²-bench Telecom и высокую точность в Berkeley Function Calling v4.
Обновленная модель сохраняет стабильное качество работы с длинным контекстом до 2 миллионов токенов, существенно превосходя предшественника Grok 4.
Представлен Agent Tools API — серверный набор инструментов, который позволяет автономным агентам Grok выполнять сложные задачи с веб-поиском, запуском кода, доступом к документам и интеграцией с внешними системами.

Команда xAI раскрыла новые данные о своей последней модели Grok 4.1 Fast, продемонстрировавшей выдающиеся показатели в сравнительных тестах с конкурентами. Модель уверенно лидирует по ряду ключевых метрик, что подчеркивает ее потенциал в качестве платформы для автономных агентов.

В частности, Grok 4.1 Fast достиг максимального результата в 100% на бенчмарке τ²-bench Telecom — тесте, ориентированном на использование инструментов, что значительно превосходит показатели Grok 4, GPT-5.1 и Claude Sonnet 4.5. В тестах на вызов функций (Berkeley Function Calling v4) модель продемонстрировала 72% точности при низких затратах, что делает ее лидером в области качественного и рассуждающего использования внешних инструментов.

Особое внимание уделено работе с длинным контекстом: благодаря применению обучения с подкреплением на длинных цепочках Grok 4.1 Fast сохраняет стабильное качество обработки информации вплоть до 2-миллионного контекстного окна. Это значительное улучшение по сравнению с предыдущей версией Grok 4, у которой аналогичный показатель составляет лишь 22%.

Помимо усовершенствования самой модели, xAI детально описали Agent Tools API — инфраструктуру, предоставляющую Grok доступ к реальным данным и расширяющей функциональность автономных агентов. Этот API позволяет выполнять веб-поиск в реальном времени, запускать Python-код в изолированной среде, обращаться к загруженным документам с интеллектуальным поиском, а также интегрироваться с внешними MCP-серверами, например корпоративными системами. Ключевая особенность — полное управление инструментами на серверной стороне xAI, что освобождает разработчиков от необходимости вручную настраивать доступы, лимиты и окружения. Модель сама оптимально расставляет приоритеты и выстраивает цепочку действий, включая возможность параллельной работы с инструментами.

На данный момент доступны две версии модели: grok-4-1-fast-reasoning для задач, требующих глубоких рассуждений, и grok-4-1-fast-non-reasoning для оперативных ответов. До 3 декабря обе версии и инструменты Agent Tools API предоставляются бесплатно на платформе OpenRouter и для пользователей xAI.

Данные нововведения свидетельствуют о целенаправленном развитии xAI в направлении создания высокоэффективных автономных агентов с широкими возможностями интеграции, что может существенно повлиять на дальнейшее развитие искусственного интеллекта и его практического применения.