- Alibaba официально запустила свою новую мощную языковую модель Qwen-3-Max после периода Preview.
- Модель обладает более триллионом параметров и архитектурой Mixture of Experts, что обеспечивает эффективное использование ресурсов.
- Версия Qwen-3-Max Thinking, ориентированная на рассуждения, близка к уровню GPT-5-Pro и Grok 4 Heavy по результатам популярных бенчмарков.
Компания Alibaba представила финальную версию своей новой языковой модели Qwen-3-Max, которая с начала сентября была доступна в режиме Preview. Теперь каждый желающий может бесплатно опробовать модель на официальном сайте разработчика.
Qwen-3-Max заметно улучшила свои показатели в сравнении с конкурентами, такими как Claude Opus 4 и DeepSeek V3.1. В рейтинге LMArena модель заняла третье место, опередив GPT-5-Chat и Claude Opus 4 Thinking. Эти достижения стали возможны благодаря масштабной архитектуре с количеством параметров, превышающим один триллион, и применению технологии Mixture of Experts. Последняя позволяет активировать лишь необходимые части модели для решения конкретных задач, что существенно снижает затраты вычислительных ресурсов.
Одновременно Alibaba завершает тренировку специальной версии Qwen-3-Max Thinking, ориентированной на рассуждающие задачи. По данным компании, эта версия демонстрирует уровень производительности, сопоставимый с моделями GPT-5-Pro и Grok 4 Heavy в таких бенчмарках как AIME 2025, GPQA и HMMT25. Однако точная дата релиза этой модификации пока не уточнена и будет объявлена отдельно.