Вышло обновление Claude Opus 4.6 — улучшена мощь ИИ Anthropic

Главное:

Anthropic выпустила обновление Claude Opus 4.6 с улучшенной работой с кодом и контекстом.
Модель получила контекстное окно на 1 миллион токенов и значительно повысила эффективность в прикладных задачах.
Opus 4.6 лидирует по ряду бенчмарков и предлагает новые инструменты для разработчиков без ухудшения безопасности.

Компания Anthropic представила новое крупное обновление своей искусственной интеллектуальной модели Claude Opus 4.6, которое знаменует собой значительный прогресс в области обработки кода и работы с большими объёмами информации. Главной особенностью релиза стал серьёзный апгрейд возможностей для программирования: модель стала лучше удерживать контекст, более тщательно планировать последовательность действий, а также эффективно работать с крупными кодовыми базами. Помимо этого, Claude Opus 4.6 научилась лучше самостоятельно обнаруживать ошибки и проводить ревизию кода, что существенно повышает надёжность автоматизации разработки.

Революционным нововведением стала поддержка контекстного окна объёмом до 1 миллиона токенов, что пока доступно в бета-версии и впервые реализовано в линейке Opus. Это заметно расширяет границы использования модели для анализа больших документов, сложных диалогов, а также параллельного выполнения задач, например, в финансовом анализе, исследовательской работе, составлении презентаций и управлении таблицами. Благодаря этим нововведениям Claude Opus 4.6 может автономно выполнять разнообразные задачи в среде Cowork, минимизируя необходимость постоянного вмешательства пользователя.

В подтверждение высокой эффективности модель продемонстрировала выдающиеся результаты на нескольких отраслевых бенчмарках. Она заняла лидирующие позиции в агентном программировании (Terminal-Bench 2.0), преуспела в тесте Humanity’s Last Exam, а также значительно опередила конкурентов в GDPval-AA — тесте, оценивающем выполнение экономически значимых задач в финансовой, юридической и аналитической сферах. Кроме того, модель продемонстрировала рекордное качество поиска редкой информации в интернете.

Особое внимание разработчики уделили улучшению работы с длинным контекстом: Opus 4.6 гораздо меньше «забывает» данные в объёмных диалогах и документах. Тесты по извлечению информации из больших текстовых массивов показали количественное превосходство модели над предыдущими версиями, выражающееся кратным, а не просто процентным улучшением. Это может иметь большое значение для задач, где критична целостность и полнота анализа больших массивов данных.

Несмотря на усиление возможностей, модель сохранила стабильный профиль безопасности: показатели дезориентации и избыточных отказов остались низкими, что говорит о внимательном балансе между сложностью и надёжностью работы искусственного интеллекта. Для разработчиков введены новые инструменты, такие как уровни сложности рассуждений (effort), адаптивное мышление, автоматическое сжатие контекста и поддержка вывода объёмом до 128 тысяч токенов. При этом стоимость использования модели не изменилась.

Claude Opus 4.6 уже доступен пользователям через классический интерфейс Claude, API и облачные платформы, что открывает широкие возможности для интеграции в самые разные области применения — от программирования до работы с большими документами и аналитикой.

Читайте также