Пути алгоритмов ютуба неисповедимы. По всей Земле разносится стон блогеров, которым заблокировали канал или сняли монетизацию по ни одному кожаному ублюдку не известным причинам. В попытках защититься от бана, блогеры уже придумывают собственный тайный язык. К примеру, Культас, любящий обсудить на своём канале повесточку, на полном серьёзе не использует слово «расизм», заменяя его словом «равиоли» - и алгоритмы со своим огненным мечом проходят мимо.
Но другим везёт меньше. Например, шахматному блогеру Антонио Радичу. Однажды он, как ни в чём ни бывало, обозревал на своём эфире турнир американского гроссмейстера Хикару Накамуры, как вдруг его канал заблокировали за «вредоносный и опасный контент». Через сутки разблокировали, но осадочек остался. Радич предположил, что, в соответствии с новейшими культурными тенденциями, всё дело в цвете шахмат. Есть белые, а есть чёрные. И белые чёрных иногда могут атаковать! А это, как вы понимаете, равиоли.
И можно было бы посмеяться, мол, не так страшны перегибы в борьбе с хейтспичем, как их малюют, но спустя несколько месяцев двое инженеров из Университета Карнеги Меллон - Рупак Саркар и Ашикур ХудаБухш – решили проверить, а как, правда, алгоритмы относятся к риторике «белые против чёрных» в контексте шахмат? Они собрали 681 995 комментариев под постами популярных шахматных блогеров и прогнали их через два классификатора речи из тех, которые можно натренировать искать в словах язык ненависти.
Затем рандомно выбрали 1000 комментариев, которые хотя бы один классификатор пометил как хейтспич, и проанализировали их вручную. Оказалось, что 82% комментов на самом деле не содержали ненависти, но слова «белый», «чёрный», «атака» и «угроза», видимо, стриггерили нейросеть. Но она не виновата! Просто она тренируются на массивах естественного языка, а в жизни люди редко обсуждают шахматы. Вот данных и не хватило.
При этом, отмечают авторы исследования, шахматы – самая уравнительная игра, какую только можно представить. Как они пришли к этому выводу – читайте в статье (там всего абзац в конце).
В общем, спасибо, алгоритмы. Теперь я представляю фразу «чёрная пешка съела белую» и мерзко хихикаю.