Найти в Дзене
IT Еxtra

Урок 8. Кластеризация — как компьютер сам находит группы, когда ему ничего не сказали

Предыдущий урок: Урок 7. Случайный лес — когда думают не одно, а много деревьев До этого момента мы занимались задачами обучения с учителем. Это когда у нас есть данные, и к каждому объекту прикреплена “правильная метка” — например, что цветок относится к виду «setosa» или что площадь квартиры равна 70 м² и цена у неё — 8 200 000 рублей. Модель смотрит на примеры, учится и затем делает предсказания для новых данных. Но в реальной жизни огромное количество задач устроены иначе. Например: база клиентов магазина; коллекция фотографий; список товаров; набор отзывов; данные датчиков с завода. И всё это — просто набор объектов, без указания меток. Но при этом мы подозреваем, что внутри данных скрыта структура: похожие объекты должны образовывать группы, а отличающиеся — располагаться где-то поодаль. И вот тут появляется задача кластеризации. Кластеризация — это когда компьютер сам находит группы (“кластеры”) похожих объектов. Это как если бы ты пришёл на склад, где свалены тысячи товаров, и
Публикация доступна с подпиской
Базовый