2 года назад
Четыре метода, которые повысят качество работы с Pandas
Источник: Nuances of Programming Вступление Кем бы вы ни были — специалистом по обработке данных, инженером данных, аналитиком данных или экспертом по машинному обучению — рано или поздно вам придется иметь дело с табличными данными. Если же вы пользователь Python, вам просто не обойтись без библиотеки табличных данных — Pandas 🐼. Поскольку табличные данные вездесущи, Pandas, пожалуй, является одной из самых используемых библиотек среди всех нас, работающих с данными. Pandas предлагает многофункциональный API для преобразования данных и извлечения из них ценной информации...
187 читали · 1 год назад
Переход с Pandas на Polars: 7 простых шагов
Источник: Nuances of Programming Pandas может делать все. Практически все. Но (как бы ни хотелось, чтобы было иначе) ему не хватает скорости. Pandas просто не поспевает за темпами, соответствующими увеличению объемов и сложности современных наборов данных. Создатель Pandas Уэс Маккинни утверждает, что придерживался следующего правила при разработке своей библиотеки: Объем оперативной памяти должен в 5–10 раз превышать объем набора данных. Возможно, вы игнорировали это правило, когда набор данных Iris только появился, но сегодня все иначе...