Anthropic выпустила Claude 4.5 Opus: новый ИИ для кода стал дешевле

Главное:

Компания Anthropic выпустила Claude Opus 4.5 — новую улучшенную модель ИИ для программирования и комплексных задач.
Модель демонстрирует лучшие результаты в отраслевых тестах и существенно повышает качество решений в многошаговых сценариях.
Цена использования Opus 4.5 снижена в три раза по сравнению с предыдущей версией, сохраняя высокий уровень производительности.

Компания Anthropic представила обновлённую версию своей передовой модели искусственного интеллекта — Claude Opus 4.5, которая была заявлена разработчиками как лучшая в мире среди ИИ для программирования, создания агентов и работы с компьютерными задачами. Новинка демонстрирует значительное улучшение возможностей по сравнению с предыдущими версиями семейства Opus, включая более глубокие исследования, работу с таблицами и оформление презентаций.

Одним из ключевых достоинств Claude Opus 4.5 стала её эффективность в решении программных и инженерных задач. В различных отраслевых тестах модель вышла в лидеры, заметно опередив конкурентов. Например, на тестовом наборе SWE-bench Verified и SWE-bench Multilingual она заняла первое место в семи из восьми языков программирования. Кроме того, в тесте Aider Polyglot, ориентированном на многоязычное программирование, Opus 4.5 показала улучшение на 10 процентных пунктов относительно предыдущей версии Sonnet 4.5. Внутренние испытания включали жёсткий двухчасовой экзамен по кодированию, где ИИ превзошёл любые человеческие результаты.

Особое внимание в новом релизе уделено поведению модели при выполнении многошаговых задач. В одном из бенчмарков под названием τ2-bench, где агент играет роль сотрудника авиакомпании, Claude Opus 4.5 проявила креативный подход, предложив пользователю повышение класса обслуживания, что позволяло изменить бронирование. Хотя формально такой ответ не совпал с ожидаемым, неспецифичным для теста сценарием, он демонстрирует гибкость и ближе к «живому» общению, что отмечают разработчики и пользователи.

Среди новых технических возможностей следует выделить параметр effort в API модели, который позволяет регулировать глубину размышлений. Выбирая между быстрым и более тщательным режимами, пользователи получают баланс между скоростью ответа и качеством решения. По данным Anthropic, при среднем уровне усилий Opus 4.5 достигает сравнимых с Sonnet 4.5 результатов на SWE-bench Verified, при этом затрачивая почти вдвое меньше выходных токенов. При максимальной нагрузке модель улучшает показатели ещё сильнее, одновременно экономя ресурсы.

Дополнительные улучшения включают эффективное сжатие контекста, продвинутые алгоритмы управления памятью и координацию нескольких агентов, что в совокупности добавляет заметный прирост в задачах глубоких исследований. Существенное снижение цены — теперь $5 за миллион входных и $25 за миллион выходных токенов против $15 и $75 ранее — наряду с высокими техническими характеристиками делают Claude Opus 4.5 привлекательным решением для широкого круга пользователей, стремящихся получить качественный ИИ функционал с оптимальными затратами.

Таким образом, релиз Claude Opus 4.5 укрепляет позиции Anthropic в области искусственного интеллекта для программистов и специалистов, востребованных в многозадачных вычислительных процессах, и открывает новые перспективы для применения ИИ в сложных профессиональных сценариях.