Однажды мы обещали сделать серию постов с разбором базовых алгоритмов машинного обучения: открывает нашу подборку kNN — метод k Nearest Neighbors или «k ближайших соседей»
Что такое метод k ближайших соседей?
kNN — это один из самых известных алгоритмов классификации в мире ML. Новички смело могут знакомиться с классификаторами — и вообще машинным обучением — именно по нему. Прелесть в том, что для понимания kNN не нужно копаться в сложных математических терминах: всё объясняется буквально на пальцах.
Что значит «классифицировать объект»? Начнём с начала. Классифицировать объект — значит отнести его к одной из нескольких заранее известных групп. Скажем, определить, к какой из пяти пород принадлежит собака. Алгоритмы в машинном обучении, как и мы с вами в жизни, принимают такие решения, опираясь на совокупность признаков. В случае с собакой это может быть, например, длина шерсти, рост в холке и форма ушей. Как их оценивают люди, более или менее понятно. Но что с нашей моделью? Что ну