Разбираемся, почему Siri иногда звучит как инопланетянин и как русская лингвистика 1970-х помогает ИИ говорить по-человечески. Поисковик, который не умеет лемматизировать, видит: Лемматизация объединяет их в одну лексему «машина», и выдача вырастает в 3-5 раз. Глагол «идти» порождает:
иду, идёшь, идёт, идём, идут, шёл, шла, шли, иди, идя, идущий…
Словарь Зализняка описывает все формы кодом «ид/ти (1c)». Нейросеть решает по контексту: «купить мыла» → «мыло», «мама мыла пол» → «мыть». Алгоритм смотрит на тип склонения из словаря Зализняка:
Павел - 1b, Павлов - 1a, и выбирает правильное окончание.