424 читали · 1 год назад
⚡️ 7 основных способов для управления столбцами в Pandas Когда дело доходит до анализа данных, Pandas является наиболее используемой библиотекой Python для обработки и подготовки данных для дальнейшего анализа и машинного обучения. • Реальность такова, что Pandas — действительно гибкая библиотека, и её можно использовать даже для преобразования форматов файлов. 1️⃣ Создание столбеца Pandas как Pandas Series # Create a Pandas series series = pd.Series([6, 12, 18, 24]) # Print Pandas series print(series) >>> 0 6 1 12 2 18 3 24 dtype: int64 2️⃣ Создание столбца Pandas как фрейма данных Pandas import pandas as pd # Create a Pandas column as a Pandas data frame df = pd.DataFrame({'A': [1, 2, 3, 4]}) # Print Pandas data frame print(df) >>> A 0 1 1 2 2 3 3 4 3️⃣ Создание столбеца Pandas как фрейм данных Pandas, используя NumPy. import numpy as np import pandas as pd # Create a NumPy array values = np.array([5, 10, 15, 20]) # Transform array into Pandas data frame df = pd.DataFrame(values) # Print data frame print(df) >>> 0 0 5 1 10 2 15 3 20 ➡️ Читать продолжение @machinelearning
157 читали · 1 год назад
Переход с Pandas на Polars: 7 простых шагов
Источник: Nuances of Programming Pandas может делать все. Практически все. Но (как бы ни хотелось, чтобы было иначе) ему не хватает скорости. Pandas просто не поспевает за темпами, соответствующими увеличению объемов и сложности современных наборов данных. Создатель Pandas Уэс Маккинни утверждает, что придерживался следующего правила при разработке своей библиотеки: Объем оперативной памяти должен в 5–10 раз превышать объем набора данных. Возможно, вы игнорировали это правило, когда набор данных Iris только появился, но сегодня все иначе...