DeepSeekMath-V2: представлен ИИ для решения олимпиадных задач

Главное:

Вышла DeepSeekMath-V2 — открытая модель ИИ, способная решать задачи уровня Международной олимпиады по математике (IMO) и Китайской математической олимпиады (CMO).
Модель показывает высокие результаты — до 118 из 120 баллов на Putnam-2024 и ориентирована на строгие доказательства, а не только на ответы.
DeepSeekMath-V2 состоит из 685 млрд параметров, распространяется с открытыми весами по лицензии Apache-2.0 и требует высокой вычислительной мощности для запуска.

Компания DeepSeek представила обновлённую версию своей специализированной модели искусственного интеллекта — DeepSeekMath-V2, предназначенную для решения сложных математических задач и построения строгих доказательств. Новая модель впервые среди открытых проектов достигла уровня, сопоставимого с так называемым «золотым» уровнем Международной олимпиады по математике (IMO-2025) и Китайской математической олимпиады (CMO-2024). Это серьёзное достижение, учитывая, что прежде подобную степень мастерства демонстрировали только закрытые системы, такие как Gemini 2.5 DeepThink и экспериментальные ИИ разработки OpenAI.

DeepSeekMath-V2 построена на базе модели DeepSeek-V3.2-Exp-Base и обучается в гибридном режиме «генератор + проверяющий». Другими словами, генератор предлагает шаги решения, а отдельный верификатор тщательно оценивает корректность каждого шага доказательства. Такая методика позволяет модели не просто выдавать ответы, а формировать подробные и надёжные обоснования, что крайне важно для задач олимпиадного уровня, требующих строгости и чёткости у аргументации.

Одним из значимых показателей является результат DeepSeekMath-V2 на задачах Putnam-2024, где модель набирает до 118 из 120 возможных баллов — это уровень, демонстрируемый ведущими экспертами в математике. При этом вес модели достигает 685 миллиардов параметров, а объём весов в формате fp8 составляет порядка 690 ГБ. Из-за такого размера и требований вычислительных ресурсов запуск DeepSeekMath-V2 в домашних условиях практически невозможен, здесь нужна инфраструктура уровня исследовательского кластера.

DeepSeek открыто предоставляет свои веса по лицензии Apache-2.0 через платформу Hugging Face, что позволяет академическому и исследовательскому сообществу изучать и использовать модель. Кроме того, модель тесно интегрирована с формальными доказчиками, например DeepSeek-Prover-V2, которые преобразуют найденные доказательства в стандартный формат Lean, широко применяемый в формальной верификации и математике.

Таким образом, появление DeepSeekMath-V2 знаменует собой значительный шаг вперёд в открытом доступе к высокотехнологичным математическим ИИ. Модель сочетает в себе продвинутую архитектуру и строгий подход к построению доказательств, что открывает новые возможности для автоматизации решения задач и научных исследований.