295 читали · 4 года назад
5 Расширенных возможностей Pandas и как ими пользоваться
Источник: Nuances of Programming Pandas — это золотой стандарт в обработке данных. А функциональные возможности библиотеки по загрузке, фильтрации, обработке и изучению данных быстро сделали ее излюбленным инструментом аналитиков. Конечно же, большинство из нас работает с самыми примитивными возможностями: загрузка данных из CSV-файла, фильтр нескольких столбцов и переход к визуализации данных. Однако в Pandas есть и малоизвестные, но от того не менее полезные функции, которые значительно упрощают обработку данных...
678 читали · 2 года назад
Python методы работы с текстовыми данными c Pandas
Если вы работаете с текстовыми данными, изучите эти методы Pandas. Текстовые данные обычно несут больше информации, чем числа. Как бы мне ни нравилось работать с числами, текстовые данные постоянно присутствуют в моем рабочем процессе. Я не измерял и не анализировал их, но мне кажется, что количество текстовых данных у меня больше, чем числовых. Наиболее существенное различие между текстовыми и числовыми данными заключается в том, сколько и предварительной обработки они требуют. Числовые данные обычно приходят в формате, который можно напрямую использовать в анализе или моделировании данных...
158 читали · 1 год назад
Переход с Pandas на Polars: 7 простых шагов
Источник: Nuances of Programming Pandas может делать все. Практически все. Но (как бы ни хотелось, чтобы было иначе) ему не хватает скорости. Pandas просто не поспевает за темпами, соответствующими увеличению объемов и сложности современных наборов данных. Создатель Pandas Уэс Маккинни утверждает, что придерживался следующего правила при разработке своей библиотеки: Объем оперативной памяти должен в 5–10 раз превышать объем набора данных. Возможно, вы игнорировали это правило, когда набор данных Iris только появился, но сегодня все иначе...