Метод силуэтов – способ изучения разделительного расстояния между результирующими кластерами Наблюдений (Observation), часто используемый вместе с Методом K-средних (K-Means). График силуэта отображает меру того, насколько близко каждая точка в одном кластере находится к точкам в соседних кластерах, и, таким образом, обеспечивает способ визуальной оценки количества кластеров. Эта мера имеет диапазон [-1, 1]: Коэффициенты силуэта (так называются эти значения) около +1 указывают на то, что образец находится далеко от соседних кластеров. Значение, близкое к нулю указывает, что выборка находится на границе принятия решения между двумя соседними кластерами или очень близко к ней, а отрицательные значения указывают на то, что эти выборки могли быть назначены неправильному кластеру. В этом примере анализ силуэта используется для выбора оптимального значения для числа кластеров (n_clusters). Графики ниже показывают, что значения n_clusters 3, 5 и 6 – плохой выбор для данных данных из-за наличи
Silhouette Method в Машинном обучении простыми словами
12 сентября 202112 сен 2021
266
1 мин