На хакатоне «ИИ‑ЗАМАН Хак» в Татарстане участникам предложили необычное задание: научить алгоритмы искусственного интеллекта «переводить» токсичные фразы на татарском языке в нейтральные, не искажая смысл сказанного. Речь шла о так называемой детоксикации текста — когда ИИ не просто ставит метку «оскорбление», а сразу предлагает вежливый вариант того же сообщения. Организаторами выступили Академия наук Татарстана и институт AIRI. Командам нужно было построить модели, способные работать с живой татарской речью: учитывать разговорные формы, сленг, заимствования и при этом улавливать оттенки агрессии. Простого фильтра здесь недостаточно: если удалить половину фразы, диалог разваливается. Поэтому ключевой задачей стала генерация перефраз — устойчивых, понятных и по‑тональному более мягких. Лучшим решением жюри признало проект команды Sota из НИУ ВШЭ и Университета ИТМО. Разработчики использовали кросс‑языковой подход: крупные русскоязычные датасеты помогли модели «понять» общую логику токс