286 читали · 3 года назад
Pandas. Шпаргалка
Pandas — это библиотека для обработки и анализа данных на языке python. Работа pandas с данными строится поверх библиотеки NumPy, являющейся инструментом более низкого уровня. Предоставляет специальные структуры данных и операции для манипулирования числовыми таблицами и временны́ми рядами. Название библиотеки происходит от эконометрического термина...
10 функций Pandas, которые я использую каждый день
Всем привет! Я — практикующий исследователь данных, и на этом канале делюсь тем, что реально работает в IT. Никакой сухой теории, только личный опыт, рабочие инструменты и грабли, на которые я уже наступил за вас. Рад, что вы здесь! Если вы работаете с данными, то наверняка сталкивались с тем, что информации слишком много, она в разной форме и с ней нужно что-то делать быстро. Я ежедневно использую Pandas для анализа, трансформации и подготовки данных, и за годы работы выделил функции и приёмы, без которых моя жизнь аналитика была бы куда сложнее...
207 читали · 2 года назад
Переход с Pandas на Polars: 7 простых шагов
Источник: Nuances of Programming Pandas может делать все. Практически все. Но (как бы ни хотелось, чтобы было иначе) ему не хватает скорости. Pandas просто не поспевает за темпами, соответствующими увеличению объемов и сложности современных наборов данных. Создатель Pandas Уэс Маккинни утверждает, что придерживался следующего правила при разработке своей библиотеки: Объем оперативной памяти должен в 5–10 раз превышать объем набора данных. Возможно, вы игнорировали это правило, когда набор данных Iris только появился, но сегодня все иначе...
6 месяцев назад
pandas в Python: Неочевидные лайфхаки быстрой обработки и анализа данных, которые скрывают от новичков!
Если вы работаете с данными на Python, обязательно попробуйте библиотеку pandas — она невероятно упрощает всё, что связано с обработкой информации. Главный "игрок" здесь — DataFrame. Ниже расскажу, как научиться пользоваться им максимально эффективно. pandas — одна из самых востребованных библиотек для анализа данных и data science на Python. Она позволяет удобно структурировать ваши данные в виде DataFrame и предлагает массу инструментов для обработки, анализа и преобразования информации. Изначально...