Источник: Nuances of Programming Часть 1, Часть 2. Очистка данных В любом проекте приходится заниматься «чисткой данных». К следующему этапу можно переходить только после приведения в порядок ваших данных. Чаще всего пропущенные данные просто добавляют. Вы можете дополнить недостающие данные разными способами: по моде, среднему значению или медиане. Пробуйте разные способы и выбирайте наиболее эффективный, абсолютного правила нет. Обычно для категориальных признаков используют только моду, а для числовых — среднее значение или медиану...
Первомай - хороший повод продолжить обсуждение всех этих "марафонцев" в историческом контексте. На днях мне читатели напомнили тезис, который я сама уже более 10 лет озвучиваю. О том, что советская система распределения благ обесценила значимость добротного образования. Потому что тогда качественное высшее образование не давало качественного преимущества в доходах или привилегиях. Работяги на северах, в шахтах, даже просто - сантехники в ДЭЗе или водители бетономешалки зарабатывали больше инженера и, тем более, учителя...