274 читали · 3 года назад
Как обнаружить выбросы в проекте по исследованию данных
Источник: Nuances of Programming В начале реализации проекта по исследованию данных важно обнаружить и обработать выбросы. В этом заключается одна из задач эксплораторного анализа данных. Мы рассмотрим три метода обнаружения выбросов. Но прежде выясним, что такое выброс, заглянув в Википедию: Выброс (в статистике)  —  это измерительная точка данных, которая значительно выделяется из общей выборки. Выбросы могут быть вызваны вариативностью измерений или указывать на экспериментальную ошибку; в последнем случае они иногда исключаются из набора данных...
9 месяцев назад
Практические советы по очистке данных на Python.
Перед началом анализа данных важно провести их очистку и подготовку. Это поможет избежать ошибок и повысить точность результатов анализа. В Python есть множество инструментов для эффективной работы с данными. Рассмотрим основные шаги для их подготовки. 1. Работа с пропусками в данных Пропуски данных часто встречаются в наборах данных и могут привести к искажениям в анализе. Чтобы обнаружить пропущенные значения, можно использовать метод isnull(), который возвращает True для ячеек с пропусками....