Под термином «стемминг» понимается нахождение стеммы – основы того или иного слова. Стемм отражает лексический смысл. К примеру, у прилагательного «вечерний» стемма будет «вечер», «барный» - «бар» и т.д. Как правило, при стемминге не учитываются суффиксы и окончания. Однако язык русский и его слова обладают достаточно сложной структурой, по этой причине стемминг зачастую используется в комбинации с иными алгоритмами лингвистики, к примеру, с лемматизацией. Зачем нужен стемминг В первую очередь, стемминговые алгоритмы активно используются поисковиками, т.е. поисковыми системами (Яндекс, Гугл, Рамблер и т.д.). Пользуясь ими, роботы систематизируют запросы интернет-пользователей и улучшают релевантность (соответствие) выдачи. Стемминг дает им возможность выделять не только термины и фразы из поискового запроса, но и всевозможные их формы, представляющие потенциальный интерес для интернет-пользователя. К примеру, пользователь ввел в поисковую строку слово «собачий», после чего перед его г
