ИИ отбирает сложную работу, оставляя людям лишь рутину

Главное:

ИИ-модель Claude преимущественно выполняет высококвалифицированные задачи, оставляя людям более простую рутинную работу.
Скорость выполнения сложной работы с помощью Claude увеличивается в 12 раз, в то время как для простых задач — в 9 раз.
При этом ИИ допускает больше ошибок на сложных задачах, что требует участия человека для проверки результатов.

Компания Anthropic представила четвёртый выпуск Anthropic Economic Index, в котором проанализировала около 2 миллионов сессий с использованием ИИ-модели Claude. В исследовании введены новые метрики для оценки экономического влияния искусственного интеллекта, позволившие сделать неожиданный вывод: ИИ всё чаще берёт на себя задачи, требующие высокого уровня квалификации, тогда как людям остаются более простые и рутинные функции.

Учёные оценивали сложность запросов и ответов с точки зрения количества лет формального образования, необходимого для их понимания. Полученная корреляция оказалась очень высокой (r > 0,92), то есть уровень формулировки запроса напрямую влияет на сложность и качество ответа ИИ. Вследствие этого Claude эффективнее ускоряет выполнение именно сложных университенских задач — в 12 раз, тогда как задачи школьного уровня ускоряются в среднем в 9 раз.

Anthropic выявила, что среднего работника экономики характеризует около 13 лет образования, а запросы к Claude – около 14 лет, что свидетельствует о том, что именно квалифицированная работа постепенно автоматизируется. Далее в исследовании смоделирована тенденция деквалификации профессий: например, туристические агенты теряют сложные функции по планированию маршрутов, оставаясь с более простыми операционными задачами, а технические писатели – аналитическую часть работы; в то же время управляющие недвижимостью получают освобождение от рутинной административной работы, сохраняя за собой стратегические переговоры.

Однако ограничением технологии остаётся рост ошибок при выполнении сложных задач: успешность выполнения снижается с 70% для простых до 66% для университетского уровня. Для трудоёмких задач, которые у человека занимают несколько часов, модель справляется лишь в половине случаев. Версия с диалоговым режимом значительно улучшает эти показатели, повышая время работы с запросом до 19 часов. Это подчёркивает неизменную важность экспертизы человека для проверки и контроля результатов ИИ, что сохраняет значимость квалифицированных специалистов в будущем.