Векторы против комбинаторики: почему эмбеддинговый поиск упрётся в потолок — и как жить дальше
Мы так привыкли к «волшебству» эмбеддингов, что порой забываем: это геометрия с конечной размерностью, а не магия. Новая работа Weller, Boratko, Naim, Lee аккуратно кладёт на стол холодный факт: у одно-векторного dense-retrieval есть жёсткие теоретические границы. И речь не о надуманных «злых» запросах — ограничения проявляются уже на крошечных задачах вида «выбери топ-2 документа». Мне эта статья понравилась тем, что она наконец-то связывает IR-практику с формальными ограничителями из математики и теории коммуникационной сложности...