У нас есть данные, практически все примерно одинаковы, но встречаются и такие, которые сильно отличаются, они много больше, либо много меньше большинства значений. Как раз такие, выделяющиеся из толпы данные, и есть выбросы. Они появляются из-за ошибок в данных. Их необходимо искать и, конечно, их необходимо удалять.
Есть несколько способ поиска выбросов:
1. Поиск и удаление по порогу.
Тут мы