В России опубликовали крупный набор данных для обучения ИИ электронной торговле
Центр искусственного интеллекта группы «Т-Технологии» выложил в открытый доступ T-ECD (T-Tech E-commerce Cross-Domain Dataset) — один из крупнейших в мире датасетов для рекомендательных систем в области электронной торговли.CNews
Датасет собран на основе обезличенных действий 44 миллионов уникальных пользователей сервисов "Шопинг" и "Супермаркеты" в приложении Т-Банка, а также рекламной платформы компании, 30 миллионов товаров и более 135 миллиардов взаимодействий.РИА Новости
Датасет подходит для большинства типов рекомендательных задач – рекомендации одного следующего объекта (next-item), следующей корзины (next-basket), следующей сессии (session-based), общих топ-N рекомендаций и других типов задач.CNews
Датасет содержит информацию о признаках пользователей и товаров, явную и неявную обратную связь, а также данные о просмотрах с указанием источника — поиск, каталог или рекомендации.Ferra