- Alibaba представила две новые модели Qwen3.5 — Qwen3.5-Plus и Qwen3.5-397B-A17B — в чат-боте и мобильном приложении Qwen Chat.
- Обе модели бесплатны и поддерживают обработку текста, изображений и видео.
- Флагманская Qwen3.5-397B-A17B — MoE-модель с 397 млрд параметров и 262 тыс. токенов контекстного окна, Qwen3.5-Plus обеспечивает контекст до 1 млн токенов.
Компания Alibaba расширила функционал своего чат-бота Qwen Chat и мобильного приложения, добавив две новые модели искусственного интеллекта нового поколения — Qwen3.5-Plus и Qwen3.5-397B-A17B. Оба варианта теперь доступны пользователям бесплатно, позволяя не только работать с текстом, но и обрабатывать изображения и видео, что значительно расширяет возможности взаимодействия.
Флагманская модель Qwen3.5-397B-A17B представляет собой разреженную модель с экспертизой (Mixture of Experts, MoE) и содержит 397 миллиардов параметров, однако одновременно активными в работе являются 17 миллиардов. Архитектура этой модели строится на основе решений, реализованных в предыдущей версии Qwen3-Next. В частности, применяются технологии sparse MoE, линейное внимание и предсказание нескольких токенов за раз, что обеспечивает высокую производительность и эффективное управление ресурсами. Помимо широкого контекстного окна на входе (до 262 тысяч токенов), модель может генерировать до 65 тысяч токенов на выходе. Qwen3.5-397B-A17B поддерживает два режима работы: режим «рассуждения» для более глубокого анализа и режим обычного ответа.
Второй представленная модель — Qwen3.5-Plus — является последним крупным апгрейдом серии Qwen3.5 и сочетает продвинутые возможности обработки текста и мультимедийного контента. Главным отличием этой версии выступает усиленное контекстное окно, способное принимать до одного миллиона токенов, что открывает перспективы для работы с очень длинными текстами и комплексными мультимедийными данными. Лимит вывода при генерации остается на уровне 65 тысяч токенов.
Ранее — на прошлой неделе — сведения о подготовке моделей Qwen3.5 появились благодаря обновлению репозитория HuggingFace Transformers, где был интегрирован код поддержки новой серии. Как стало известно из пулл-реквеста, модели Qwen3.5 базируются на гибридном механизме внимания и представлены в по меньшей мере двух конфигурациях — компактной и MoE. Данное обновление было одобрено и включено в репозиторий 9 февраля.
Таким образом, Alibaba делает очередной шаг в развитии искусственного интеллекта, предлагая пользователям бесплатный доступ к мощным и универсальным инструментам с впечатляющими показателями обработки контекста и мультимодальных данных. Такой прогресс свидетельствует о стремлении компании закрепиться на передовом рубеже ИИ-технологий и расширять границы взаимодействия человека и машины.
