Сотрудники Имперского колледжа Лондона предложили решение этой проблемы нелегального использования текстового контента для обучения языковых моделей искусственного интеллекта с помощью «ловушек авторского права». Этот метод основан на скрытой маркировке текста для определения его применения в AI. Технология схожа с существующими инструментами борьбы с нарушением авторских прав, такими как: фальшивые слова и термины в словарях, а также несуществующие геоточки на картах.
Согласно исследованию, проведенному на основании работы с двуязычной моделью CroissantLLM, технология оказалась достаточно эффективной. В ходе тестов были сгенерированы и внедрены в оригинальный текст предложения, лишенные смысла, которые, позднее, были обнаружены языковой моделью, что и стало доказательством использования материала при ее обучении.
Специалисты подчеркивают, что повторение фраз может изменить изначальный текст и позволить компаниям-разработчикам AI предусмотреть защиту от использования «ловушек». Однако в настоящее время, новый метод может стать эффективным средством от нарушений авторских прав.
Ученые разработали механизм защиты авторских прав от AI
28 июля 202428 июл 2024
6
~1 мин
Взгляните на эти темы