Алтай
Агломеративная кластеризация и дендрограмма в Python
Рассмотрим один из способов распределения объектов по группам - агломеративную кластеризацию в Python. Она является разновидностью иерархического алгоритма и заключается в последовательном объединении точек в кластеры. При этом сначала каждый объект лежит в отдельной группе, после на каждом шаге самые близкие кластеры объединяются на основании выбранных метрик расстояния. В качестве дистанций между кластерами часто принимают: В качестве метрики расстояния между точками обычно используется евклидова мера (также поддерживается много других, например, корреляция, косинусное различие)...
Кластеризация данных методом k-средних
📌 Больше полезных статей по информатике и программированию вы можете найти у нас на сайте. 📢 Следить за новостями мира информатики, а также общаться, делиться впечатлениями и готовиться к экзаменам лучше вместе, в нашем Telegram-канале. В прошлой статье мы уже разобрались с тем, что такое кластеризация, для чего она применяется, и сравнили два самых популярных алгоритма. Сейчас нам предстоит познакомиться поближе с алгоритмом k-средних, понять принцип его работы и рассмотреть реализацию на языке Python...