52 прочтения · 4 года назад
Машинное обучение. С чего начать? Часть 2
Источник: Nuances of Programming Часть 1, Часть 2. Очистка данных В любом проекте приходится заниматься «чисткой данных». К следующему этапу можно переходить только после приведения в порядок ваших данных. Чаще всего пропущенные данные просто добавляют. Вы можете дополнить недостающие данные разными способами: по моде, среднему значению или медиане. Пробуйте разные способы и выбирайте наиболее эффективный, абсолютного правила нет. Обычно для категориальных признаков используют только моду, а для числовых — среднее значение или медиану...
4,3K прочтений · 1 год назад
Бум онлайн-марафонов и советское обесценивание высшего образования. Рабочий в СССР зарабатывал больше профессора
Первомай - хороший повод продолжить обсуждение всех этих "марафонцев" в историческом контексте. На днях мне читатели напомнили тезис, который я сама уже более 10 лет озвучиваю. О том, что советская система распределения благ обесценила значимость добротного образования. Потому что тогда качественное высшее образование не давало качественного преимущества в доходах или привилегиях. Работяги на северах, в шахтах, даже просто - сантехники в ДЭЗе или водители бетономешалки зарабатывали больше инженера и, тем более, учителя...