Когда мы говорим про «новое SEO», почти всегда всплывает слово «эмбеддинги». Звучит как что‑то из машинного обучения, но на практике это просто способ представить смысл текста в виде чисел. Разберём, как это работает и зачем это знать SEO‑специалисту. Классический поиск ищет совпадения по словам. Проблема в том, что люди формулируют один и тот же запрос десятками разных фраз. Эмбеддинги позволяют моделям сравнивать уже не сами слова, а смысл. Система переводит текст в вектор — точку в многомерном пространстве — и смотрит, какие точки находятся рядом. Похожий смысл — близкие векторы. Разный смысл — векторы далеко друг от друга. Благодаря этому поиск может понимать, что «расторгнуть договор» и «отменить соглашение» — это про одно и то же, даже если формулировки отличаются. Упрощённо pipeline такой:
– документ попадает в систему;
– его разбивают на отдельные куски (чанки);
– каждый чанк прогоняют через модель эмбеддингов;
– на выходе получают набор векторов, которые кладут в векторную баз