Само дерево - это структура Яндекс.Маркет, около 3500 категорий (это открытые данные, Яндекс публикует Ексель). Дальше мы делаем синонимизацию категорий, векторизацию категорий и товаров и ищем схожие в векторах (числа). Точность очень высокая, что удивительно. Зачем? Это удобно для матчинга и других наших задач. Модель ИИ для векторизации уже тут публиковал - она бесплатная. Работает на сервере в фоне. Русский ИТ бизнес
Сделали на проекте poisk.im сервис категоризации товаров к глобальному дереву
14 января14 янв
3
~1 мин