MiniMax M2.5 — новая флагманская модель для кодинга и ИИ задач

Главное:

MiniMax представила модель MiniMax-M2.5, ориентированную на кодинг, использование инструментов и офисные задачи.
M2.5 демонстрирует высокую производительность по бенчмаркам, включая 80.2% на SWE-Bench Verified и существенное снижение времени решения задач по сравнению с предыдущей версией.
Модель использует инновационную RL-инфраструктуру, обеспечивающую до 40× ускорения обучения, и уже внедрена в MiniMax Agent с более чем 10 000 созданных пользователями кастомных «Experts».

Компания MiniMax представила новую флагманскую модель искусственного интеллекта MiniMax-M2.5, которая специально разработана для задач программирования, взаимодействия с инструментами и работы в офисных сценариях. Модель была обучена с применением методов обучения с подкреплением (RL) в более чем 200 тысячах реальных сред, что позволило достичь высокого качества выполнения сложных заданий.

По результатам тестирования на профильных бенчмарках M2.5 достигла 80,2% на SWE-Bench Verified, 51,3% на Multi-SWE-Bench и 76,3% на BrowseComp с управлением контекстом. В частности, модель стала на 37% быстрее предыдущей версии M2.1: среднее время решения задач сократилось с 31,3 до 22,8 минут, что сопоставимо с временем работы модели Opus 4.6, но при этом стоимость вычислений уменьшилась примерно в десять раз.

В области программирования MiniMax-M2.5 обучалась на более чем десяти языках, включая Go, C/C++, Rust, TypeScript, Python и Java. Модель проявляет выраженную способность к предварительному планированию, эффективно декомпозируя требования и формулируя архитектуру перед генерацией кода. По отдельным наборам задач она показывает результаты немного выше конкурентов, подтверждая тем самым свою высокую квалификацию именно в кодинге.

Кроме того, в агентных сценариях MiniMax-M2.5 демонстрирует снижение количества поисковых итераций примерно на 20% по сравнению с предыдущей версией M2.1, достигая лучших результатов. Скорость вывода достигает 100 токенов в секунду в Lightning-версии, что обеспечивает высокую производительность при работе с текстами и командами в реальном времени. Стоимость использования модели составляет $0,3 за миллион входных токенов и $2,4 за миллион выходных токенов (Lightning-версия), при этом базовая версия обходится вдвое дешевле.

Значимым технологическим достижением стала разработка внутреннего фреймворка Forge — инфраструктуры для обучения с подкреплением, отделяющей агентный слой от движка обучения и обеспечивающей до 40-кратного ускорения процесса тренировки. Использование алгоритма CISPO и систем процессных наград повышает стабильность работы модели при обучении с учетом длительных агентных траекторий.

Новинка уже интегрирована в MiniMax Agent, где пользователи создали свыше 10 000 кастомных экспертных систем («Experts»), объединяющих офисные навыки и специализированную логику для задач, связанных с финансовыми моделями, исследовательской деятельностью и программированием.

Таким образом, MiniMax-M2.5 представляет собой значительный шаг вперед в развитии моделей ИИ для программирования и рабочих процессов, предлагая пользователям быстрое, качественное и экономичное решение с мощной поддержкой инфраструктуры обучения.