Python с нуля от А до Я #1 [установка, типы данных, как с ними работать, как запустить программу]
NaN, None, NA: отличия и секреты [часть 1]
В python отсутствие значений у переменной/объекта может отражаться как NaN, <NA> или None. Попробуем разобраться, чем они различаются и зачем нужны (см. табл. 1). None - это объект класса NoneType, который встроен в python и может использоваться без импорта иных библиотек. None показывает отсутствие значения или состояния у объекта. Поскольку это объект нечислового типа, его обработка замедляет работу кода при больших объемах данных по сравнению с nan и NA. Пример проверки переменной на отсутствие значения (None) для типа str (текстовое значение)...
Предобработка данных. Работа с пропусками. Python.
Пропуск это просто отсутствие значения. Это часто встречающееся явление в датасетах. Да, вещь не приятная и ухудшает данные. Но ничего с этим не поделать. Мы можем только с ними поработать и улучшить качество нашего датасета. Есть такая замечательная библиотека в python как pandas. С её помощью мы и будем работать с пропусками. Так же нам понадобится библиотека numpy. Загружаем библиотеки и создаем небольшой датасет с пропусками: Теперь у нас есть настоящий датасет с пропусками. С ним то мы и поработаем...