Международная исследовательская группа с участием ученых факультета компьютерных наук НИУ ВШЭ представила корпус KoWit-24, предназначенный для изучения того, как системы искусственного интеллекта распознают игру слов в новостных заголовках. Проект включает 2700 заголовков одного из русскоязычных СМИ, в которых используется каламбур, и позволяет оценить не только способность ИИ замечать языковую игру, но и объяснять ее смысл. Результаты работы были представлены на конференции RANLP, статья опубликована в репозитории Arxiv.org, а сам датасет и код экспериментов выложены на GitHub. Исследователи отмечают, что для читателя подобные заголовки обычно не требуют пояснений, тогда как для языковых моделей они остаются сложной задачей. Даже современные системы, включая ChatGPT и GigaChat Max, часто ошибаются, особенно при попытке объяснить, на чем именно построена шутка. Корпус KoWit-24 охватывает материалы за период с января 2021 по декабрь 2023 года и снабжен контекстом: к каждому заголовку до
Ученые выяснили, каким образом нейросети распознают и объясняют каламбуры
29 декабря 202529 дек 2025
64
2 мин