Шесть ключевых изменений в LLM в 2025 году по версии Андрея Карпати Обложка: Skyread

Шесть ключевых изменений в LLM в 2025 году по версии Андрея Карпати

Новости
Главное:

  • 2025 год ознаменовался принципиальными концептуальными сдвигами в развитии больших языковых моделей (LLM), согласно аналитику Андрею Карпати.
  • Введён новый этап обучения RLVR (Reinforcement Learning from Verifiable Rewards), дающий моделям возможность самостоятельно открывать стратегии рассуждения, что превосходит традиционные подходы по улучшению качества.
  • Появились новые форматы взаимодействия с LLM — локальные агенты и интегрированные приложения, разбивающие стереотипы облачных сервисов и устаревших текстовых интерфейсов.

Андрей Карпати, эксперт в области искусственного интеллекта, один из основателей OpenAI и бывший руководитель ИИ в Tesla, представил итоги 2025 года в развитии больших языковых моделей. По его мнению, прошедший год не отметился увеличением размеров моделей, как это было ранее, а стал переломным моментом в понимании природы и применения LLM.

Ключевым технологическим достижением Карпати считает внедрение этапа обучения RLVR — усиленного обучения с проверяемыми наградами. В отличие от классических подходов, где модели дообучают на вручную аннотированных данных или обратной связи, RLVR использует задачи, в которых можно автоматически верифицировать правильность ответов, например, в математике и программировании. Это позволяет моделям самостоятельно выстраивать сложные стратегии рассуждения, которые сложно формализовать напрямую. По словам Карпати, именно этот методический сдвиг, а не рост числа параметров, стал главным двигателем прогресса в 2025 году.

Кроме того, эксперт выдвинул новое концептуальное представление о языковых моделях — они не «развивающиеся организмы», а скорее «призраки», вызванные человеком, обладающие непоследовательным интеллектом. Модели способны проявлять гениальность и одновременно допускать детские ошибки, что существенно подрывает доверие к классическим бенчмаркам, используемым для оценки ИИ.

Ещё одно значительное изменение — появление новых типов прикладных решений. Инструменты типа Cursor, которые управляют сложными цепочками запросов к модели и предоставляют специализированные интерфейсы с регуляторами автономности, демонстрируют, как слой приложений поверх LLM становится самостоятельным рынком. По мнению Карпати, развитие этого направления ставит вопрос о перераспределении доходов между разработчиками моделей и приложений.

Карпати обращает внимание на пример Claude Code, локального LLM-агента, работающего на устройстве пользователя и минималистичного по интерфейсу. По его мнению, смещение акцента с облачных решений на локальное исполнение — важное направление для будущего взаимодействия с искусственным интеллектом, где он станет «духом», постоянно находящимся в распоряжении пользователя.

Новейшее явление в программировании заслуживает отдельного упоминания: «vibe coding» — создание программ на естественном языке без глубокого погружения в синтаксис кода. Этот подход радикально упрощает процесс, снимая барьеры для новичков и упрощая прототипирование. Сам Карпати лично применяет эту концепцию для создания собственных проектов, включая высокопроизводительный токенизатор на языке Rust.

Также эксперт отметил ранний образец GUI для LLM — Google Gemini Nano Banana. В отличие от традиционного текстового диалога, напоминающего командную строку, это направление ориентируется на богатую мультимодальную генерацию с изображениями, анимацией и интерактивностью, что значительно расширяет репертуар задач и удобство взаимодействия для человека.

В завершение обзора Карпати констатировал, что возможности больших языковых моделей в 2025 году оказались выше и ниже его ожиданий одновременно, а индустрия реализовала всего около 10% потенциальных возможностей ИИ. Поле для исследований и экспериментов остаётся широко открытым, и в ближайшие годы прогресс обещает быть стремительным.

Tagged