IBM представила Granite 4.0 — ИИ, превзошедший Gemma 3 27B Обложка: Skyread

IBM представила Granite 4.0 — ИИ, превзошедший Gemma 3 27B

Новости
Главное:

  • IBM представила семейство открытых языковых моделей Granite 4.0 с параметрами от 3 до 32 миллиардов.
  • Granite 4.0 H Small по интеллектуальному индексу Artificial Analysis Intelligence Index обошла модель Gemma 3 27B.
  • Модели поддерживают длинное контекстное окно в 128 тысяч токенов и лицензируются под Apache 2.0, с возможностью дообучения.

Компания IBM анонсировала новую линейку языковых моделей Granite 4.0, которая включает версии с параметрами от 3 до 32 миллиардов, доступные под открытой лицензией Apache 2.0. Особенностью Granite 4.0 является архитектура, сочетающая классические трансформерные слои внимания с многими слоями Mamba — разновидностью моделей со скрытым состоянием (state-space models, SSM). Такой гибридный подход позволяет существенно снизить требования к памяти и ускорить обработку длинных последовательностей без значимой потери эффективности.

Одной из ключевых моделей является Granite 4.0 H Small с 32 миллиардами параметров (из которых 9 млрд активных), которая уже доступна на платформе Replicate по цене $0,06 за миллион входных и $0,25 за миллион выходных токенов. Кроме того, все версии — H Small, H Tiny (7B/1B), H Micro (3B/3B) и Micro (3B/3B) — можно загрузить и использовать с Hugging Face.

Экспертная оценка языковой модели Granite 4.0 была проведена с помощью комплекса из десяти строгих бенчмарков, объединённых в Artificial Analysis Intelligence Index. По этому индексу Granite 4.0 H Small набрала 23 балла, что выше, чем у предшествующей Granite 3.3 8B (15) и на один пункт превосходит модель Gemma 3 27B (22). Модель Granite 4.0 Micro с 3 миллиардами параметров также показала результат лучше, чем Gemma 3 4B.

Отдельное внимание учёные уделили эффективности использования токенов: Granite 4.0 H Small для прохождения тестов потребовала около 5,2 миллионов выходных токенов, что существенно ниже, чем у большинства существующих моделей весом до 40 миллиардов параметров. Это сокращает вычислительные затраты и повышает практическую применимость.

Поддержка контекстного окна длиной в 128 тысяч токенов и сниженные вычислительные требования делают Granite 4.0 особенно актуальными для задач извлечения знаний из объёмных документов и технологий Retrieval-Augmented Generation (RAG). В дополнение, открытая лицензия вместе с возможностью дообучения (например, с помощью методики LoRA) позволяет компаниям гибко адаптировать модели под свои специфические задачи и домены.

Tagged