- MiniMax представила модель MiniMax-M2.5, ориентированную на кодинг, использование инструментов и офисные задачи.
- M2.5 демонстрирует высокую производительность по бенчмаркам, включая 80.2% на SWE-Bench Verified и существенное снижение времени решения задач по сравнению с предыдущей версией.
- Модель использует инновационную RL-инфраструктуру, обеспечивающую до 40× ускорения обучения, и уже внедрена в MiniMax Agent с более чем 10 000 созданных пользователями кастомных «Experts».
Компания MiniMax представила новую флагманскую модель искусственного интеллекта MiniMax-M2.5, которая специально разработана для задач программирования, взаимодействия с инструментами и работы в офисных сценариях. Модель была обучена с применением методов обучения с подкреплением (RL) в более чем 200 тысячах реальных сред, что позволило достичь высокого качества выполнения сложных заданий.
По результатам тестирования на профильных бенчмарках M2.5 достигла 80,2% на SWE-Bench Verified, 51,3% на Multi-SWE-Bench и 76,3% на BrowseComp с управлением контекстом. В частности, модель стала на 37% быстрее предыдущей версии M2.1: среднее время решения задач сократилось с 31,3 до 22,8 минут, что сопоставимо с временем работы модели Opus 4.6, но при этом стоимость вычислений уменьшилась примерно в десять раз.
В области программирования MiniMax-M2.5 обучалась на более чем десяти языках, включая Go, C/C++, Rust, TypeScript, Python и Java. Модель проявляет выраженную способность к предварительному планированию, эффективно декомпозируя требования и формулируя архитектуру перед генерацией кода. По отдельным наборам задач она показывает результаты немного выше конкурентов, подтверждая тем самым свою высокую квалификацию именно в кодинге.
Кроме того, в агентных сценариях MiniMax-M2.5 демонстрирует снижение количества поисковых итераций примерно на 20% по сравнению с предыдущей версией M2.1, достигая лучших результатов. Скорость вывода достигает 100 токенов в секунду в Lightning-версии, что обеспечивает высокую производительность при работе с текстами и командами в реальном времени. Стоимость использования модели составляет $0,3 за миллион входных токенов и $2,4 за миллион выходных токенов (Lightning-версия), при этом базовая версия обходится вдвое дешевле.
Значимым технологическим достижением стала разработка внутреннего фреймворка Forge — инфраструктуры для обучения с подкреплением, отделяющей агентный слой от движка обучения и обеспечивающей до 40-кратного ускорения процесса тренировки. Использование алгоритма CISPO и систем процессных наград повышает стабильность работы модели при обучении с учетом длительных агентных траекторий.
Новинка уже интегрирована в MiniMax Agent, где пользователи создали свыше 10 000 кастомных экспертных систем («Experts»), объединяющих офисные навыки и специализированную логику для задач, связанных с финансовыми моделями, исследовательской деятельностью и программированием.
Таким образом, MiniMax-M2.5 представляет собой значительный шаг вперед в развитии моделей ИИ для программирования и рабочих процессов, предлагая пользователям быстрое, качественное и экономичное решение с мощной поддержкой инфраструктуры обучения.
