Kimi K2.5 — бесплатный ИИ с режимом «рой агентов»

Главное:

Moonshot AI представила Kimi K2.5 — мультимодальную модель с новым режимом «рой агентов», позволяющим до 100 субагентов работать параллельно.
Метод PARL обеспечивает декомпозицию задач на подзадачи и их распределение среди субагентов, что ускоряет выполнение сложных задач в 4,5 раза.
K2.5 демонстрирует высокое качество в визуальных тестах и обладает функциями кодинга с визуальным вводом, при этом режим «рой агентов» доступен по подписке.

Китайская компания Moonshot AI анонсировала выход обновлённой версии своей мультимодальной модели — Kimi K2.5. Главной инновацией стала возможность одновременной работы до 100 субагентов в новом режиме «Agent Swarm» («рой агентов»). Эта функция позволяет существенно повысить скорость и эффективность решения сложных задач: по заявлению разработчиков, благодаря параллельной координации до 1500 вызовов инструментов за сессию производительность выросла в 4,5 раза по сравнению с одиночным агентом.

Модель K2.5 построена на базе предыдущей версии K2 и дообучена на 15 триллионах мультимодальных токенов. Ключевым технологическим новшеством стала разработка PARL (Parallel-Agent Reinforcement Learning) — обучаемого оркестратора, который разбивает общую задачу на множество параллельных подзадач и распределяет их между субагентами, причём они остаются «замороженными» (не дообучаются в процессе работы). Это решение также позволило преодолеть проблему «последовательного коллапса», когда модель начинает выполнять задачи лишь последовательно, а не параллельно, благодаря введению метрики Critical Steps и поэтапного формирования награды.

Особое внимание в K2.5 уделено возможностям кодирования с визуальным вводом. Модель способна создавать код, анализируя видеозаписи активности на экране — в демонстрации она с нуля воспроизвела веб-сайт, просматривая запись экрана. Кроме того, реализован «автономный визуальный дебаггинг»: модель самостоятельно оценивает результаты своей работы и корректирует ошибки на итеративной основе. Для профессиональных разработчиков создан инструмент Kimi Code — терминальное решение с открытым исходным кодом, совместимое с VSCode, Cursor и Zed. Этот инструмент принимает на вход изображения и видео, автозагружая настроечные MCP-конфигурации.

Тестирование K2.5 в режиме Thinking показало её лидерство в ряде визуальных бенчмарков: OCRBench (92,3 балла против 80,7 у GPT-5.2), InfoVQA (92,6 против 84,0), MathVista (90,1 — лучший результат). Тем не менее, в «чистом» рассуждении ей немного уступают лучшие модели — так, на соревновании AIME 2025 K2.5 получил 96,1 балла против 100 у GPT-5.2, а на GPQA-Diamond — 87,6 против 92,4 у конкурента.

Режим Agent Swarm призван компенсировать эти показатели на практике. Внутренние тесты показали значительный прирост: на BrowseComp «рой агентов» набрал 78,4 балла по сравнению с 60,6 у одиночной версии K2.5 и лишь 37,0 у Claude Opus 4.5. На бенчмарке Wide Search показатели составили 79,0 и 72,7 соответственно. Moonshot утверждает, что при сопоставимом качестве использование K2.5 с режимом роя агентов позволяет экономить ресурсы в 5–21 раз по сравнению с GPT-5.2.

Области практического применения новой модели охватывают масштабный поиск по множеству источников, генерацию объёмных документов и пакетную обработку данных. Напомним, что режимы Instant и Thinking доступны бесплатно, тогда как режим Agent Swarm предусматривает платную подписку с начальной стоимостью $31 в месяц.