Открытый набор данных «Яндекса» помог исследователям из Нидерландов радикально сократить время обучения рекомендательных моделей без потери качества ответов В Европе использовали российский датасет, опубликованный ранее в открытом доступе, для обучения собственных ИИ-моделей и добились серьёзного ускорения обучения алгоритмов. Речь идёт о наборе Yandex, который компания опубликовала летом 2025 года. Полная версия содержит около пяти миллиардов элементов. Данные сформировали на основе обезличенной статистики «Яндекс Музыки», в том числе агрегированные прослушивания, лайки, дизлайки и характеристики треков. «Работа голландских учёных с российским датасетом наглядно демонстрирует практическую ценность открытых данных для ускорения разработки ИИ-рекомендаций. Долгое время доступ исследовательского сообщества к крупномасштабным промышленным данным был ограничен. «Яндекс», открыв Yandex, одним из первых устранил этот разрыв, предоставив уникальный инструмент для глобального прорыва в этой об
В России создали датасет, который ускорил обучение ИИ-моделей в 60 раз
27 февраля27 фев
1 мин