Источник: Nuances of Programming Часть 1, Часть 2. Очистка данных В любом проекте приходится заниматься «чисткой данных». К следующему этапу можно переходить только после приведения в порядок ваших данных. Чаще всего пропущенные данные просто добавляют. Вы можете дополнить недостающие данные разными способами: по моде, среднему значению или медиане. Пробуйте разные способы и выбирайте наиболее эффективный, абсолютного правила нет. Обычно для категориальных признаков используют только моду, а для числовых — среднее значение или медиану...
Как обучается компьютер? Как он учится видеть закономерности и анализировать данные? Для этого есть несколько алгоритмов – расскажем о них подробнее в статье. Машинное обучение – это способность компьютера выводить новые алгоритмы на основе изученных данных. Такое обучение используется во многих видах бизнеса – для упрощения аналитики и улучшения стратегии маркетинга. В основном, машинное обучение сводится к обработке большого количества данных и созданию прогнозов на их основе, а также оно помогает в работе некоторых сервисов – например, в автоматическом распознавании лиц или объектов...