ИИ-браузеры нового поколения научились обходить платные стены

Главное:

Новое поколение ИИ-браузеров, включая Atlas от OpenAI и Comet от Perplexity, способно обходить пейволлы на сайтах новостных изданий.
Atlas и Comet получают доступ к полным текстам статей, которые доступны только подписчикам, обходя защиту, основанную на блокировке поисковых роботов и всплывающих окнах.
OpenAI утверждает, что по умолчанию не использует контент из таких ИИ-браузеров для обучения своих моделей, если не активирована функция «памяти браузера».

В последнее время на рынке появились браузеры, интегрированные с искусственным интеллектом, такие как Atlas от OpenAI и Comet от Perplexity, которые отличаются от традиционных Chrome и Safari наличием ИИ-агентов. Эти агенты предназначены для выполнения сложных задач и оказываются способны обходить ограничения на доступ к контенту, установленные новостными изданиями в виде пейволлов.

Журналисты Columbia Journalism Review провели эксперимент, используя Atlas и Comet для получения полной версии статьи из MIT Technology Review, которая обычно доступна только подписчикам. В отличие от стандартных интерфейсов ChatGPT и Perplexity, которые не смогли получить доступ к статье из-за блокировки поисковых роботов, ИИ-браузеры успешно прочитали весь материал. Это стало возможным благодаря техническим особенностям: ИИ-агент Atlas маскируется под обычного пользователя, а не как автоматизированная система с цифровым идентификатором, что позволяет обойти протоколы исключения поисковых роботов.

Кроме того, некоторые сайты, такие как MIT Technology Review, National Geographic и Philadelphia Inquirer, используют метод клиентской накладки пейволла: полный текст загружается на страницу, но скрывается всплывающим окном с предложением подписаться. ИИ-системы способны читать этот скрытый контент, поскольку он фактически присутствует в браузере. В то же время другие издания, например Wall Street Journal и Bloomberg, применяют более надежную защиту, не отправляя полный текст без проверки учётных данных пользователя.

OpenAI подчеркнула, что не обучает свои большие языковые модели на контенте, доступном пользователям через браузер Atlas, если только не включена функция «памяти браузера». Это означает, что страницы, защищённые от веб-скрейпинга, не используются для обучения, хотя сама система запоминает определённые детали из просматриваемого контента для улучшения взаимодействия с пользователем. Однако, как отмечает Washington Post, детали работы функции памяти остаются недостаточно прозрачными.

Стоит отметить, что Atlas старается избегать чтения материалов из медиакомпаний, которые в настоящее время ведут судебные процессы с OpenAI. Тем не менее при запросах пользователей он применяет обходные методы, используя альтернативные источники с которыми у OpenAI есть лицензионные соглашения, такие как Guardian, Washington Post и Reuters, чтобы создавать краткие содержания статей, например, из New York Times.

Таким образом, новое поколение ИИ-браузеров демонстрирует возможности обхода традиционных ограничений доступа к информации в интернете, что поднимает сложные вопросы о правовом статусе, этике и устойчивости медиарынка в эпоху искусственного интеллекта.