Международная группа исследователей, в которую вошли специалисты факультета компьютерных наук ВШЭ, представила корпус KoWit-24 — коллекцию из 2700 газетных заголовков российских СМИ с каламбурами. С его помощью ученые проверили, насколько хорошо большие языковые модели распознают и объясняют игру слов. Как пишет naked-science.ru, тестирование пяти таких моделей показало: даже самые продвинутые системы регулярно ошибаются, а объяснение шутки оказывается для них значительно сложнее, чем простое её обнаружение. Результаты были представлены на конференции RANLP, статья доступна на Arxiv.org, а сам датасет и программный код выложены на GitHub. Под игрой слов авторы понимают намеренное создание двусмысленности ради привлечения внимания, иронии или комического эффекта. В российских новостных заголовках это может быть замена части устойчивого выражения или переосмысление фразеологизма. Например, заголовок «Особо бумажные персоны» обыгрывает выражение «особо важные персоны», сдвигая смысл к бум
Международная команда исследователей выяснила, как ИИ видит игру слов
30 декабря 202530 дек 2025
46
2 мин