Метод k-средних (k-Means Clustering) – это очень известный и мощный алгоритм Обучения без учителя (Unsupervised Learning), который группирует похожие элементы в k кластеров. Он используется для решения многих сложных задач Машинного обучения (ML). Пример. Предположим, мы пошли в магазин за овощами и увидели, что они будут расположены на полках по типу. Вся морковь хранится в одном месте, картошка – в другом. До применения кластеризации (появления окрашенных зон и обозначения записей разными иконками) перепутать категорию довольно легко...
Кластеризация без учителя при распознавании изображений — это многоэтапный процесс. Он включает предварительную обработку, извлечение признаков, кластеризацию по сходству и оценку оптимального количества кластеров с использованием меры качества. Все эти шаги реализуются в Python-пакете Clustimage, которому в качестве входных данных нужны только пути или необработанные значения пикселей. Цель clustimage – обнаружить естественные группы или кластеры изображений, используя методы ilhouette, dbindex и их производные, в сочетании с методами кластеризации (agglomerative, kmeans, dbscan и hdbscan)...