- Китайская MiniMax 18 марта представила языковую модель M2.7, которую компания описывает как систему с элементами самоулучшения.
- Модель набрала 56,22% на SWE-Pro и 55,6% на VIBE-Pro — это тесты на реальные задачи программирования.
- M2.7 доступна через API и в Ollama; базовая цена API — $0,3 за 1 млн входных токенов и $1,2 за 1 млн выходных.
MiniMax 18 марта выпустила модель M2.7 с упором на программирование, офисные задачи и агентные сценарии — то есть цепочки действий, где ИИ не просто отвечает, а выполняет несколько шагов подряд. Модель уже доступна через API компании и для локального запуска через Ollama.
Главная особенность M2.7 — механизм самоулучшения. По описанию MiniMax, модель умеет разбирать собственные ошибки, менять код своего рабочего окружения, запускать тесты и сохранять удачные изменения. В одном из внутренних тестов за 100 итераций производительность выросла на 30%.
Отдельный акцент сделан на задачах разработки. В бенчмарке SWE-Pro, который проверяет ИИ на реальных инженерных задачах, M2.7 показала 56,22%. В тесте VIBE-Pro результат составил 55,6%. Также компания заявляет, что модель лучше адаптировали для работы с Excel, PowerPoint и Word: речь идет о многошаговом редактировании, правках по шаблонам и обработке документов.
С технической стороны M2.7 построена по схеме MoE — это архитектура, где общая модель очень большая, но при каждом запросе задействуется только часть параметров. Всего у нее 230 млрд параметров, из которых на один токен активны 10 млрд. Такой подход нужен, чтобы сохранить высокую производительность без резкого роста вычислительной нагрузки.
MiniMax также продвигает M2.7 как модель для агентных задач. Компания заявляет поддержку более 40 сложных навыков и 97% точности следования инструкциям. Для доступа есть поминутная оплата по токенам и подписки с лимитом запросов: планы начинаются от $10 в месяц, а high-speed-версия модели стоит вдвое дороже по API.
Рынок ИИ-моделей все активнее смещается от обычных чат-ответов к сценариям, где система пишет код, работает с документами и выполняет цепочки действий. MiniMax в описании M2.7 делает ставку именно на такие прикладные задачи.
Для разработчиков это еще один инструмент для отладки, тестов и автоматизации рутинной работы с кодом. Для компаний — вариант использовать ИИ не только в чате, но и в таблицах, документах и многошаговых офисных процессах.