1909 читали · 3 года назад
Предобработка данных. Работа с пропусками. Python.
Пропуск это просто отсутствие значения. Это часто встречающееся явление в датасетах. Да, вещь не приятная и ухудшает данные. Но ничего с этим не поделать. Мы можем только с ними поработать и улучшить качество нашего датасета. Есть такая замечательная библиотека в python как pandas. С её помощью мы и будем работать с пропусками. Так же нам понадобится библиотека numpy. Загружаем библиотеки и создаем небольшой датасет с пропусками: Теперь у нас есть настоящий датасет с пропусками. С ним то мы и поработаем...
119 читали · 2 года назад
Импорт данных в Python: чтение и запись файлов Excel
Всем привет! Я так понимаю, вас интересует тема анализа данных? Иначе вас бы здесь не было! Но для начала данные необходимо импортировать в Python. Помимо баз данных, средством достижения этой цели являются файлы. В сфере науки о данных чаще всего используются файлы в формате csv (значения, разделённые запятыми), но нередко можно встретить также формат Excel (xlsx), потому что почти во всех компаниях Excel по-прежнему является самым популярным программным обеспечением для редактирования таблиц. Я покажу вам, как читать файлы Excel в Python...