930 читали · 2 года назад
NaN, None, NA: отличия и секреты [часть 1]
В python отсутствие значений у переменной/объекта может отражаться как NaN, <NA> или None. Попробуем разобраться, чем они различаются и зачем нужны (см. табл. 1). None - это объект класса NoneType, который встроен в python и может использоваться без импорта иных библиотек. None показывает отсутствие значения или состояния у объекта. Поскольку это объект нечислового типа, его обработка замедляет работу кода при больших объемах данных по сравнению с nan и NA. Пример проверки переменной на отсутствие значения (None) для типа str (текстовое значение)...
3 года назад
Приручаем отсутствующие значения (null, nan, None...)
Сложность работы с отсутствующими значениями при определенных знаниях оборачивается преимуществом, и в этой статье я расскажу, как с ними подружиться. Не будем касаться темы их замены или фильтрации, о которых я рассказывал раннее (например, в этом материале). При этом замечу, что делать это стоит в крайнем случае и не на этапе промежуточной обработки признаков, так как иначе по прошествии времени сложно будет определить, что использовалось для замены (я уже не говорю о проблемах в случае попыток понять ваш код другими разработчиками)...