Рассмотрим один из способов распределения объектов по группам - агломеративную кластеризацию в Python. Она является разновидностью иерархического алгоритма и заключается в последовательном объединении точек в кластеры. При этом сначала каждый объект лежит в отдельной группе, после на каждом шаге самые близкие кластеры объединяются на основании выбранных метрик расстояния. В качестве дистанций между кластерами часто принимают: В качестве метрики расстояния между точками обычно используется евклидова мера (также поддерживается много других, например, корреляция, косинусное различие)...
Доброго времени суток, читатели, зрители моего канала programmer's notes. Не забывайте подписываться и писать свои комментарии к моим статьям и видео. Вспомните также и математику Статистика на python, модуль statistics Вернулся к старым незаконченным темам. Всё равно нужно ведь заканчивать. Тем более планирую в будущем сложные библиотеки для обработки массивов данных, а тут модуль statistics, стандартный модуль ещё не рассматривал. Надо сказать, что простые статистические характеристики можно и так легко вычислить...