Найти в Дзене
МК

В России обсуждают обязательное раскрытие наборов данных для обучения ИИ

В России обсуждается инициатива обязать разработчиков отечественных моделей искусственного интеллекта раскрывать сведения о наборах данных, на которых обучались и тестировались нейросети. Об этом сообщили участники обсуждения, знакомые с подготовкой профильного законопроекта. Предполагается, что компании должны будут указывать название набора данных, дату его создания, назначение, формат, объем и происхождение. Рассматриваются варианты создания отдельного реестра отечественного ИИ либо реестра наборов данных. Где именно будет аккумулироваться такая информация, пока не определено, пишут Ведомости. В Минцифры подтвердили, что в текущей версии рамочного законопроекта требований о раскрытии обучающих данных нет. Документ пока носит общий характер и определяет базовые подходы к регулированию отрасли. Правительство также прорабатывает критерии «российской» нейросети, вопросы авторского права, маркировки ИИ-контента, ответственности за нарушения и предотвращения использования ИИ в преступных
    Фото: генерация ChatGPT
Фото: генерация ChatGPT

В России обсуждается инициатива обязать разработчиков отечественных моделей искусственного интеллекта раскрывать сведения о наборах данных, на которых обучались и тестировались нейросети. Об этом сообщили участники обсуждения, знакомые с подготовкой профильного законопроекта.

Предполагается, что компании должны будут указывать название набора данных, дату его создания, назначение, формат, объем и происхождение. Рассматриваются варианты создания отдельного реестра отечественного ИИ либо реестра наборов данных. Где именно будет аккумулироваться такая информация, пока не определено, пишут Ведомости.

В Минцифры подтвердили, что в текущей версии рамочного законопроекта требований о раскрытии обучающих данных нет. Документ пока носит общий характер и определяет базовые подходы к регулированию отрасли.

Правительство также прорабатывает критерии «российской» нейросети, вопросы авторского права, маркировки ИИ-контента, ответственности за нарушения и предотвращения использования ИИ в преступных целях. Рассматривается возможность признания применения ИИ отягчающим обстоятельством при совершении правонарушений.

Представители отрасли указывают, что полное описание массивов данных может потребовать значительных ресурсов и стать формальностью без реальной аналитической ценности. Кроме того, раскрытие информации может затронуть коммерческие интересы разработчиков и замедлить вывод новых решений на рынок.

В то же время сторонники инициативы считают, что прозрачность повысит доверие к моделям, позволит независимую оценку качества и дисциплинирует работу с данными. Это также может способствовать формированию легального рынка данных и снижению рисков использования материалов без разрешения правообладателей.

Эксперты отмечают, что при введении обязательного раскрытия потребуется разработка гибких лицензионных механизмов. В международной практике подобные требования уже применяются, однако их реализация связана с юридическими и техническими сложностями.

Пока окончательные решения по инициативе не приняты. Обсуждение продолжается на площадках профильных ассоциаций и ведомств.

Читайте также: Останки мертвой девочки без руки обнаружил мотоциклист в безлюдной зоне

Подпишитесь на Telegram "МК": еще больше эксклюзивов и видео!

Автор: Петр Осинцев