Шесть ключевых изменений в LLM в 2025 году по версии Андрея Карпати

Главное:

2025 год ознаменовался принципиальными концептуальными сдвигами в развитии больших языковых моделей (LLM), согласно аналитику Андрею Карпати.
Введён новый этап обучения RLVR (Reinforcement Learning from Verifiable Rewards), дающий моделям возможность самостоятельно открывать стратегии рассуждения, что превосходит традиционные подходы по улучшению качества.
Появились новые форматы взаимодействия с LLM — локальные агенты и интегрированные приложения, разбивающие стереотипы облачных сервисов и устаревших текстовых интерфейсов.

Андрей Карпати, эксперт в области искусственного интеллекта, один из основателей OpenAI и бывший руководитель ИИ в Tesla, представил итоги 2025 года в развитии больших языковых моделей. По его мнению, прошедший год не отметился увеличением размеров моделей, как это было ранее, а стал переломным моментом в понимании природы и применения LLM.

Ключевым технологическим достижением Карпати считает внедрение этапа обучения RLVR — усиленного обучения с проверяемыми наградами. В отличие от классических подходов, где модели дообучают на вручную аннотированных данных или обратной связи, RLVR использует задачи, в которых можно автоматически верифицировать правильность ответов, например, в математике и программировании. Это позволяет моделям самостоятельно выстраивать сложные стратегии рассуждения, которые сложно формализовать напрямую. По словам Карпати, именно этот методический сдвиг, а не рост числа параметров, стал главным двигателем прогресса в 2025 году.

Кроме того, эксперт выдвинул новое концептуальное представление о языковых моделях — они не «развивающиеся организмы», а скорее «призраки», вызванные человеком, обладающие непоследовательным интеллектом. Модели способны проявлять гениальность и одновременно допускать детские ошибки, что существенно подрывает доверие к классическим бенчмаркам, используемым для оценки ИИ.

Ещё одно значительное изменение — появление новых типов прикладных решений. Инструменты типа Cursor, которые управляют сложными цепочками запросов к модели и предоставляют специализированные интерфейсы с регуляторами автономности, демонстрируют, как слой приложений поверх LLM становится самостоятельным рынком. По мнению Карпати, развитие этого направления ставит вопрос о перераспределении доходов между разработчиками моделей и приложений.

Карпати обращает внимание на пример Claude Code, локального LLM-агента, работающего на устройстве пользователя и минималистичного по интерфейсу. По его мнению, смещение акцента с облачных решений на локальное исполнение — важное направление для будущего взаимодействия с искусственным интеллектом, где он станет «духом», постоянно находящимся в распоряжении пользователя.

Новейшее явление в программировании заслуживает отдельного упоминания: «vibe coding» — создание программ на естественном языке без глубокого погружения в синтаксис кода. Этот подход радикально упрощает процесс, снимая барьеры для новичков и упрощая прототипирование. Сам Карпати лично применяет эту концепцию для создания собственных проектов, включая высокопроизводительный токенизатор на языке Rust.

Также эксперт отметил ранний образец GUI для LLM — Google Gemini Nano Banana. В отличие от традиционного текстового диалога, напоминающего командную строку, это направление ориентируется на богатую мультимодальную генерацию с изображениями, анимацией и интерактивностью, что значительно расширяет репертуар задач и удобство взаимодействия для человека.

В завершение обзора Карпати констатировал, что возможности больших языковых моделей в 2025 году оказались выше и ниже его ожиданий одновременно, а индустрия реализовала всего около 10% потенциальных возможностей ИИ. Поле для исследований и экспериментов остаётся широко открытым, и в ближайшие годы прогресс обещает быть стремительным.