Главные новости недели: GPT-5.4, MacBook M5 Max и автоматизация ML-исследований Обложка: Skyread

Главные новости недели: GPT-5.4, MacBook M5 Max и автоматизация ML-исследований

Новости
Главное:

  • OpenAI выпустил GPT-5.4 с контекстом до 1 миллиона токенов и интеграцией кода с интеллектуальными задачами.
  • Anthropic представил Claude Code Review — мультиагентную систему для высокоточной автоматизации проверки кода.
  • Apple анонсировала новые MacBook с чипами M5 Pro и M5 Max, значительно ускоряющими локальный запуск ИИ-моделей.

OpenAI представил флагманскую модель GPT-5.4 и её Pro-версию, доступные одновременно, что является нетипичным шагом. Основным новшеством стала первая в семействе 5.x модель, которая объединяет обработку кода и интеллектуальных задач в одной платформе. Максимальный контекст увеличен до одного миллиона токенов, однако при этом точность обработки снижается с ростом объёма: для небольших контекстов (16–32 тыс.) она достигает 97%, но при приближении к миллиону падает до 36%. Кроме того, в Codex после 272 тыс. токенов использование ресурсов удваивается, поэтому практический лимит составляет около 256 тыс. токенов.

Для разработчиков и исследователей OpenAI расширил возможности Codex, включая нативный sandbox с уровнями доступа на Windows и поддержку популярных оболочек. Запущена программа Codex for Open Source, предоставляющая мейнтейнерам крупных проектов бесплатный доступ к инструментам автоматизации и ревью на базе ИИ. Аналогичную инициативу реализовала компания Anthropic, предлагая бесплатное использование Claude Max для поддержки open source.

Anthropic представил инновационную систему Claude Code Review с мультиагентной архитектурой, в которой несколько ИИ одновременно ищут ошибки, проверяют и оценивают их важность. Благодаря этой системе доля полезных комментариев к pull request выросла с 16% до 54%, при этом доля ложных срабатываний не превысила 1%. Стоимость одноразового ревью оценивается в $15-25, что уже начинает формировать новый стандарт в индустрии – сочетание ИИ-генерации и автоматизированной проверки кода как базовый этап разработки.

Google выпустил модель Gemini 3.1 Flash-Lite с регулируемой скоростью мышления (thinking level), высокой производительностью и мультимодальным вводом. В плане цены и функционала эта модель позиционируется как облегченное решение для пайплайнов обработки текста и мультимедиа, конкурируя не с топовыми ИИ, а с моделями среднего уровня.

В инженерном сообществе вызвал интерес проект autoresearch от Андрея Карпаты, который демонстрирует, как ИИ-агент автоматически настраивает параметры обучения моделей без участия человека, добиваясь улучшения качества и сокращения времени обучения. Такой подход, близкий к концепции «vibe training», уже применяется не только для обучения, но и в прикладных проектах, открывая перспективу масштабных распределённых исследований.

Apple анонсировала новые MacBook с процессорами M5 Pro и M5 Max, увеличив объём единой памяти до 64 и 128 ГБ соответственно и двукратно скорость SSD. Главное преимущество для специалистов по машинному обучению — ускорение локального инференса языковых моделей до четырёх раз по сравнению с предыдущими поколениями, что существенно снижает зависимость от облачных сервисов.

В технической сфере также отметили выход FlashAttention-4, существенно ускоряющего внимание в трансформерах на уровне матричных умножений, и интеграцию этой технологии в PyTorch. Помимо этого, фреймворк vLLM получил обновление с поддержкой новых моделей и значительным ускорением на архитектуре MI300.

Не осталась незамеченной новинка от Microsoft – Copilot Cowork, интегрированная с технологиями Anthropic, что вызвало бурные обсуждения и вопросы о стратегическом партнерстве компаний.

Таким образом, индустрия ИИ и машинного обучения активно развивается как в части фундаментальных моделей и инструментов, так и в аппаратном обеспечении, приближая возможности локального и эффективного применения нейросетей.

Tagged