Релиз GLM-5: фокус на длинных задачах и инженерных сценариях

Главное:

Выпущена новая версия open-source модели GLM-5 с увеличенным масштабом и улучшенными возможностями для долгосрочного планирования.
GLM-5 демонстрирует улучшенные результаты в бенчмарках, особенно в задачах с долгосрочным горизонтом, таких как управление виртуальным вендинговым бизнесом.
Модель поддерживает генерацию рабочих документов (.docx, .pdf, .xlsx) и имеет собственный Agent Mode для многотурового взаимодействия с инструментами офисных приложений.

Компания Z.ai представила GLM-5 — новую архитектуру открытой модели, ориентированную на решение комплексных инженерных задач и задачи с длительной перспективой (long-horizon). В сравнении с предшественником GLM-4.5, размер модели почти удвоился и теперь составляет 744 миллиарда параметров, из которых 40 миллиардов активно используются во время инференса. Одновременно с этим увеличилось и количество токенов, использованных для предобучения — с 23 до 28,5 триллионов.

Ключевым техническим нововведением стал внедрённый механизм DeepSeek Sparse Attention, который позволяет эффективно работать с длинными контекстами, одновременно снижая стоимость вычислений при генерации ответов. Для ускорения этапа постобучения разработчики создали собственную асинхронную инфраструктуру RL под названием slime. Она минимизирует время ожидания в процессе reinforcement learning и позволяет чаще обновлять модель, что положительно сказывается на качестве и скорости обучения.

По результатам тестирования GLM-5 последовательно обходит GLM-4.7 и занимает лидирующие позиции в группе open-source моделей. Так, в бенчмарке SWE-bench Verified модель набирает 77,8 балла по сравнению с 73,8 у предыдущей версии. В задачи Terminal-Bench 2.0 и BrowseComp с управлением контекстом также отмечается высокое качество результатов. Особенно выделяется Vending Bench 2, где GLM-5 достигает итогового баланса в 4432 условных единицы за год симуляции, что свидетельствует о мощных возможностях в долгосрочном стратегическом планировании. При этом модель занимает первое место среди open-source и демонстрирует близкие показатели к коммерческому продукту Claude Opus 4.5.

Особое внимание в новой версии уделено переходу от традиционных чат-ботов к полноценным рабочим инструментам. GLM-5 научилась самостоятельно создавать документы в форматах .docx, .pdf и .xlsx. Новый режим Agent Mode интегрируется с офисными приложениями, такими как Word, Excel и PDF-ридерами, обеспечивая многотуровое взаимодействие, что существенно расширяет спектр практического применения модели.

Модель распространяется под лицензией MIT и доступна для загрузки на платформах Hugging Face и ModelScope. Она поддерживает локальное развёртывание с использованием vLLM, SGLang и может быть запущена на альтернативных аппаратных решениях, включая процессоры Huawei Ascend и другие чипы, не относящиеся к NVIDIA.

Таким образом, GLM-5 задаёт новый стандарт для открытых моделей искусственного интеллекта, ориентированных на решение задач, требующих глубокого анализа длинных последовательностей и сложного планирования, что делает её привлекательной как для исследователей, так и для разработчиков прикладных решений в области AI.