Источник: Nuances of Programming Часть 1, Часть 2. Очистка данных В любом проекте приходится заниматься «чисткой данных». К следующему этапу можно переходить только после приведения в порядок ваших данных. Чаще всего пропущенные данные просто добавляют. Вы можете дополнить недостающие данные разными способами: по моде, среднему значению или медиане. Пробуйте разные способы и выбирайте наиболее эффективный, абсолютного правила нет. Обычно для категориальных признаков используют только моду, а для числовых — среднее значение или медиану...
SQL - фундаментальный навык для аналитиков данных, но его применение иногда ограничивается конвейером данных. Однако SQL можно успешно использовать для многих задач предварительной обработки, таких как очистка данных и обработка данных, как показано здесь на примере...