Вышли младшие модели Qwen-3.5: 9B превзошла ИИ в 13 раз крупнее

Главное:

Alibaba Cloud выпустила пять компактных моделей серии Qwen 3.5 с параметрами от 0.8 до 9 миллиардов.
9B-модель превосходит по качеству более крупные аналоги, демонстрируя лучшие результаты на ключевых бенчмарках.
Все модели поддерживают мультимодальность с единым пайплайном для текста, изображений и видео и могут обрабатывать до 262 тысяч токенов в контексте.

Команда Qwen из Alibaba Cloud представила новую серию компактных моделей искусственного интеллекта Qwen 3.5, включающую пять версий с количеством параметров от 0.8 до 9 миллиардов. Эти модели открыты для сообщества под лицензией Apache 2.0 и доступны на платформах Hugging Face, ModelScope и Ollama. Линейка стала завершающей в серии обновлений, начатой в феврале с выпуска флагманских и средних моделей.

Особое внимание привлекает версия с 9 миллиардами параметров, которая удивляет многими успехами. В тестах MMLU-Pro она набирает 82.5 балла, превосходя GPT-OSS-120B и собственную крупную модель Qwen3-30B-A3B, имеющую втрое больше параметров. Аналогичные успехи демонстрируются на бенчмарке GPQA Diamond — 81.7 против 73.4 у Qwen3-30B-A3B. Более того, в агентных задачах новая модель демонстрирует показатели, которые ранее были доступны только гораздо более крупным системам.

Инновация Qwen 3.5 заключается в гибридной архитектуре Gated DeltaNet + Gated Attention в пропорции 3:1, что позволяет эффективно работать с контекстом длиной до 262 тысяч токенов, а при необходимости — расширяться до миллиона. При этом модели изначально мультимодальны: они единым пайплайном обрабатывают текст, изображения и видео без необходимости создавать отдельные версии для разных типов данных. Расширена и языковая поддержка — теперь модель понимает 201 язык, что существенно революционизирует возможности для пользователей по всему миру.

Даже в менее объёмных версиях серии, например, 4B, показатели впечатляют и сравнимы с крупными конкурентами, при этом для их запуска достаточно доступного оборудования, такого как видеокарты уровня RTX 3060 или 4060. Самая компактная модель в 0.8 миллиарда параметров ориентирована на встроенные и edge-устройства, что расширяет спектр практического применения серии Qwen 3.5.

Таким образом, Alibaba Cloud удалось значительно повысить эффективность и качество ИИ-моделей при одновременном сокращении вычислительных ресурсов, открывая новые возможности для применения искусственного интеллекта как в облаке, так и на локальных устройствах.