- В России планируют обязать разработчиков ИИ раскрывать данные для обучения нейросетей.
- Законопроект разрабатывается Минцифры и отраслевыми ассоциациями, предусматривая ведение реестра данных.
- Отрасль выражает опасения по поводу затрат и практической ценности введения такой отчетности.
В России обсуждается возможное введение обязательного раскрытия информации о данных, на которых обучаются и тестируются модели искусственного интеллекта. Согласно сообщениям, соответствующий законопроект разрабатывается при участии Министерства цифрового развития, отраслевых объединений и компаний, работающих в сфере ИИ. Планируется, что разработчики будут обязаны предоставлять подробные сведения об используемых наборах данных: наименование, дату создания, цель применения, формат, объём и происхождение.
На данный момент остаётся неясным, каким образом будет организован сбор и хранение этих сведений. Предполагается, что для этого может быть создан специальный реестр отечественного искусственного интеллекта или национальных наборов данных. Стоит отметить, что подобная инициатива уже обсуждалась в рамках подготовки федерального закона об ИИ, но не вошла в окончательную версию документа.
Эксперты отрасли отмечают, что формирование и ведение такого реестра может требовать значительных ресурсов, которые не всегда оправданы с практической точки зрения. Представитель Альянса в сфере искусственного интеллекта, включающего крупных игроков рынка, таких как «Сбер», «Яндекс», VK, Т-Банк и МТС, выразил мнение, что ведение реестра может свестись к формальному перечислению данных без аналитической пользы, либо окажется чрезмерно затратным.
Инициатива по раскрытию данных для обучения нейросетей имеет отголоски в международной практике, где технологические компании сталкиваются с многочисленными судебными исками по обвинениям в незаконном использовании контента авторов, таких как журналисты, блогеры, художники и издатели. Если российское законодательство примет подобные нормы, возможны появление аналогичных прецедентов и в нашей стране, что значительно повлияет на практику разработки и применения искусственного интеллекта.
