Пропуск – пример принципа Неопределенности (Uncertainty) в Машинном обучении (ML), отсутствующее значение ячейки:
Обработка пропусков
Поскольку Модели (Model) выдвигают требование (необходим полный датасет), выработалось несколько способов обработать – заполнить ячейки с отсутствующими значениями:
- Заполнение Средним арифметическим (Mean) для числовых Признаков (Feature), например, для столбца "Длительность звонка" на иллюстрации выше
- Заполнение Модой (Mode) для Категориальных переменных (Categorical Variable) для столбца "Образование"
- Удаление неполных записей (избавиться от строк 4, 6 и 7)
- Заполнение предыдущим / последующим значением (метод Pandas fillna()) и прочие.