Метод K-ближайших соседей (K-Nearest Neighbors, KNN) — алгоритм классификации и регрессии, основанный на гипотезе компактности. Она предполагает, что расположенные близко друг к другу объекты в пространстве признаков имеют схожие значения целевой переменной или принадлежат к одному классу. Преимущества метода K-ближайших соседей: простота, отсутствие необходимости в обучении модели, гибкость. Недостатки: высокие вычислительные затраты при работе с большими наборами данных, чувствительность к шуму и выбросам в данных. 1) Вычисляется расстояние между тестовым и всеми обучающими образцами. 2) Далее из них выбирается k-ближайших образцов (соседей), где число k задаётся заранее. 3) Итоговое прогнозом среди выбранных k-ближайших образцов будет мода в случае классификации и среднее арифметическое в случае регрессии. 4) Предыдущие шаги повторяются для всех тестовых образцов Как происходит предсказание влияние к Также зависит от выбора весов - есть две стратегии 1. все веса одинаковы 2. выбор в