482 прочтения · 2 года назад
Заполнение пропусков с Pandas
Рассмотрим, основные способы заполнения пропусков с Pandas. В демонстрационных целях создадим датафрейм: Заполнение чаще всего осуществляется с помощью метода fillna. Распространенным способом является вставка на место пропусков некоторого фиксированного значения (в fillna можно передать словарь, в котором указать для каждого столбца такое значение): Также популярно заполнение значениями из предшествующей (аргумент method='bfill') либо последующей записи (method='ffill'): Следует отметить, что для...
214 прочтений · 3 года назад
Веб-скрейпинг с нуля на Python: библиотека Beautiful Soup
Источник: Nuances of Programming Данные есть везде, на каждом посещенном вами сайте. Чаще всего они уже представлены в читаемом текстовом формате, пригодном для использования в новом проекте, однако, несмотря на то, что нужный текст всегда можно скопировать и вставить прямо со страницы сайта, когда речь заходит о больших данных  —  о тексте с десятка тысяч веб-сайтов  —  скрейпинг приходит на помощь. Обучаться веб-скрейпингу (web-scraping) поначалу сложно, однако если вы начнете своё знакомство с большими данными, используя правильные инструменты, то предстоящий вам путь существенно облегчится...