- Финальное обучение модели Kimi K2-Thinking обошлось примерно в 4,6 миллиона долларов.
- Kimi K2-Thinking является крупной нейросетью с триллионом параметров и демонстрирует конкурентоспособные результаты с западными аналогами.
- Стоимость обучения значительно ниже, чем у западных моделей, таких как GPT-4 и Grok 4, чьи бюджеты исчисляются десятками и сотнями миллионов долларов.
По информации CNBC, финальный этап обучения китайской модели искусственного интеллекта Kimi K2-Thinking потребовал затрат порядка 4,6 миллионов долларов. Данные получены от анонимного источника и не получили официального подтверждения от разработчика — компании Moonshot AI. Тем не менее, эта сумма значительно ниже затрат на обучение аналогичных западных моделей, что вызывает интерес и вопросы в профессиональной среде.
Kimi K2-Thinking представляет собой масштабную нейросеть с архитектурой Mixture of Experts и количеством параметров около одного триллиона. При работе активация происходит лишь у небольшой части модели, что позволяет эффективно справляться с сложными задачами по рассуждению и взаимодействию с различными инструментами. Обычно системы такого уровня требуют больших вычислительных ресурсов и значительных затрат, поэтому затраты в несколько миллионов выглядят весьма экономными.
Аналогичный тренд был замечен ранее на примере китайской модели DeepSeek. В 2024 году расходы на обучение её базовой версии DeepSeek-V3 составили порядка 5,5–5,6 миллиона долларов, а дополнительный модуль для рассуждений R1 — около 294 тысяч долларов. Kimi K2-Thinking базируется на архитектуре K2, что позволяет предположить схожую структуру затрат. Стоит учесть, что в расчет не включены прочие операционные расходы — от аренды помещений до зарплат сотрудников и предварительных экспериментов.
Подчёркивается, что даже с учетом возможных дополнительных затрат итоговая цена остаётся достаточно низкой, особенно в сравнении с западными проектами. Обучение GPT-4, по оценкам различных аналитиков, пришлось на суммы около 63–78 миллионов долларов, а Grok 4 потребовала на это порядка 490 миллионов. В то время как K2-Thinking при такой стоимости демонстрирует результаты, сопоставимые с этими лидерами, что свидетельствует о потенциале альтернативных подходов к созданию эффективных ИИ-моделей.
