1829 читали · 4 года назад
Агломеративная кластеризация и дендрограмма в Python
Рассмотрим один из способов распределения объектов по группам - агломеративную кластеризацию в Python. Она является разновидностью иерархического алгоритма и заключается в последовательном объединении точек в кластеры. При этом сначала каждый объект лежит в отдельной группе, после на каждом шаге самые близкие кластеры объединяются на основании выбранных метрик расстояния. В качестве дистанций между кластерами часто принимают: В качестве метрики расстояния между точками обычно используется евклидова мера (также поддерживается много других, например, корреляция, косинусное различие)...
2 года назад
Векторы (начало)
Сегодня мы узнаем 1. Что такое векторы и для чего они нужны аналитику данных 2. Какие операции с векторами можно делать (складывание, вычитание) и в чем их смысл 3. Как работать с векторами в Python 1. Что такое векторы и для чего они нужны аналитику данных В векторах хранят некоторые цифровые данные. Например, вектор, описывающий кота, мог бы выглядеть как набор цифр его возраста, веса, количества зубов, окраски (зашифрованной цветом) и других характеристик. Набор из 5 подобных векторов описывал бы всех котов тети Вали...