Добавить в корзинуПозвонить
Найти в Дзене
Кот редактора

Сегодня у многих авторов и юристов я видела примеры странного назначения дисклеймеров к текстам, которые не имеют к «наглым котикам

» никакого отношения. «Письма счастья» прилетели после проверки текстов ИИ. Мне стало интересно, а на основе чего обучали нейросети, которые производили оценку текстов, и я попыталась найти хотя бы один официальный опубликованный документ. В ходе поиска я выяснила для себя один любопытный факт. Основным официальным документом, где перечислены наркотические средства, психотропные вещества и их прекурсоры, подлежащие контролю в Российской Федерации, является Постановление Правительства РФ от 30 июня 1998 года № 681 «Об утверждении перечня наркотических средств, психотропных веществ и их прекурсоров, подлежащих контролю в Российской Федерации». Последняя редакция постановления вступила в силу 27 июля 2025 года и была утверждена Постановлением Правительства РФ от 11 июня 2025 года № 880. Но там нет тех слов, которые упоминают авторы, получившие «письма счастья». Я стала разбираться дальше. Существует еще один официальный документ — «Унифицированный ведомственный словарь терминов, использ

Сегодня у многих авторов и юристов я видела примеры странного назначения дисклеймеров к текстам, которые не имеют к «наглым котикам» никакого отношения. «Письма счастья» прилетели после проверки текстов ИИ. Мне стало интересно, а на основе чего обучали нейросети, которые производили оценку текстов, и я попыталась найти хотя бы один официальный опубликованный документ. В ходе поиска я выяснила для себя один любопытный факт.

Основным официальным документом, где перечислены наркотические средства, психотропные вещества и их прекурсоры, подлежащие контролю в Российской Федерации, является Постановление Правительства РФ от 30 июня 1998 года № 681 «Об утверждении перечня наркотических средств, психотропных веществ и их прекурсоров, подлежащих контролю в Российской Федерации». Последняя редакция постановления вступила в силу 27 июля 2025 года и была утверждена Постановлением Правительства РФ от 11 июня 2025 года № 880.

Но там нет тех слов, которые упоминают авторы, получившие «письма счастья».

Я стала разбираться дальше.

Существует еще один официальный документ — «Унифицированный ведомственный словарь терминов, используемых при оценке масштабов распространения и незаконного потребления наркотиков», разработанный ФСКН России в 2006 году. Этот документ содержит определения профессиональных и юридических терминов (например, «абстиненция», «прекурсоры», «группа риска»), но не включает сленговые выражения наркозависимых.

И тогда все стало понятно: в ИИ, судя по всему, загрузили жаргонизмы, используемые среди определенной публики!

Видимо, разработчики алгоритмов безопасности пошли по странному пути. Они взяли за основу не только официальные реестры, а еще списки сленговых терминов, которые можно найти в открытых источниках, на тематических форумах или даже в старых словарях криминального жаргона. Машине «скормили» список слов, которые иногда имеют отношение к запрещенной тематике, забыв объяснить ей самую главную вещь — контекст.

Я пришла к неприятному выводу: нейросети сейчас пытаются цензурировать не пропаганду наркотиков, а обычный русский язык. Слова «трава» (даже зеленая на лужайке), «соль» (даже на кухонном столе), «винт» (даже столярный инструмент) и масса других бытовых терминов попали в «черный список» только потому, что когда-то были переосмыслены в узкой субкультуре.

Оставлять всё как есть — неправильно. Ведь получается, что ИИ учили на плохом, неструктурированном материале. Сейчас нам нужен не просто фильтр слов, а семантический анализ. Системе необходимо дообучение на художественных текстах, чтобы она научилась различать:

🔸Прямую речь и авторский текст. Если герой-злодей использует жаргон, это не значит, что автор призывает это употреблять. Нужно, чтобы ИИ видел кавычки или атрибуцию речи.

🔸Отрицательный контекст. Слова «арест», «задержание», «передозировка», «смерть» в одном абзаце со сленгом должны интерпретироваться как предупреждение, а не просто упоминание слов.

🔸Омонимию (слова-близнецы). ИИ нужно показать тысячи примеров, где слово «трава» употребляется в значении «растение» (например: «Он косил траву»).

Платформы, которые рассылают такие предупреждения, должны задуматься: либо они продолжают генерировать тонны бесполезных писем, раздражая авторов и обесценивая свои же предупреждения, либо они инвестируют в качественное обучение нейросетей.

Авторам хочется пожелать терпения и выразить надежду, что технические ошибки ИИ — это лишь временные издержки цифровизации. Очень важно, чтобы разработчики услышали авторов и читателей уже сейчас. Необходимо дообучать машину понимать контекст, иначе скоро дисклеймеры придется ставить на половину книг только из-за того, что в них светит солнце, дует ветер, а конфета вкусная.

Данный текст является аналитическим материалом о проблемах машинного обучения. Упоминание сленговых терминов приведено исключительно для иллюстрации юридической коллизии и не является пропагандой или одобрением употребления запрещенных веществ.

#мнение #аналитика

✉️MAX

✉️Дзен