Кластеризация - это один из моих любимых подходов к анализу пространственных данных. Разнообразие возможностей применения и легкая интерпретируемость результатов делают его одним из ключевых инструментов в арсенале пространственного аналитика. Но обо все по-порядку - начнем с основы. Кластеризация - это алгоритм разметки данных без учителя. Это означает, что заранее неизвестно из кого состоит выборка, и задача алгоритма найти в ней уникальные профили. Классическим использованием кластеризации является сегментация клиентов: например, с помощью такого алгоритма онлайн-магазин может узнать, что его сервисом пользуются 2 типа покупателей: семьи с детьми и обеспеченные IT-шники одиночки - 2 "далеких" друг от друг профиля, не похожие между собой, но похожие внутри группы. Если изучать кластеризацию как часть Data Science, то непременно попадешь на эту страницу - там наглядно и подробно разобраны особенности 11 наиболее популярных методов кластеризации. Однако ни в одном из описании нет
Кластеризация в пространственных задачах, когда работают классические методы
18 ноября18 ноя
3 мин