NVIDIA предъявили иск из-за использования пиратских книг для обучения ИИ Обложка: Skyread

NVIDIA предъявили иск из-за использования пиратских книг для обучения ИИ

Новости
Главное:

  • NVIDIA вела переговоры с крупнейшей пиратской библиотекой Anna’s Archive для доступа к 500 ТБ книг с целью обучения своих языковых моделей.
  • Компания получила внутреннее разрешение для таких переговоров, несмотря на предупреждение о нелегальном статусе архивов.
  • Авторы коллективного иска обвиняют NVIDIA в использовании и распространении скриптов для автоматического скачивания пиратских датасетов, что повторяет прецедент с другим AI-разработчиком Anthropic.

Корпорация NVIDIA оказалась в центре судебного разбирательства из-за использования пиратских книг для обучения своих моделей искусственного интеллекта. В рамках расширенного коллективного иска было обнародовано, что компания проводила переговоры с Anna’s Archive — крупнейшей в мире нелегальной цифровой библиотекой, содержащей около 500 терабайт литературы. По внутренним документам NVIDIA, сотрудник отдела стратегии данных напрямую интересовался у представителей архива возможностью получить «высокоскоростной доступ» к контенту, стоимость которого оценивалась в десятки тысяч долларов.

Любопытно, что в диалоге с пиратами сотрудник компании получил предупреждение о незаконном статусе библиотеки и был спрошен об официальном разрешении на ведение таких переговоров. Спустя неделю высшее руководство NVIDIA утвердило проведение сделки. Помимо Anna’s Archive в иске представлены и другие источники нелегального контента — LibGen, Sci-Hub, Z-Library, а также датасет Books3. Истцы обвиняют NVIDIA не только в использовании данных ресурсов, но и в распространении программных скриптов для автоматизированного скачивания пиратской литературы среди корпоративных клиентов.

Данное дело приобретает особую значимость на фоне уже существующего судебного прецедента, где в сентябре 2025 года компания Anthropic согласилась урегулировать иск за $1,5 миллиарда. Тогда истец доказал, что Anthropic незаконно загружала книги с пиратских ресурсов для обучения языковой модели Claude. Суд ясно обозначил, что обучение на легально приобретённой литературе законно, но использование нелегального контента — нет.

Таким образом, ситуация вокруг NVIDIA ставит важный вопрос о правомерности использования материалов из неизвестных и часто незаконных источников в развитии искусственного интеллекта и поднимает проблему ответственности технологических компаний за соблюдение авторских прав при обучении моделей.

Tagged