Найти тему

Анализируем данные: структура Series в Pandas

Почему в работе системных аналитиков все начинается с требований? 14 июля Иннокентий Бодров на demo-занятии расскажет, зачем нужны требования к ПО и каких видов они бывают.
Demo-занятие проходит в рамках онлайн-курса «Системный аналитик. Basic». Программа ориентирована на тех, кто хочет попасть в IT-сферу и с нуля освоить эту специальность.
Вебинар даст вам полезные знания, необходимые для первых шагов в профессии, а также познакомит с преподавателем и позволит оценить качество материала.

✎﹏﹏﹏﹏﹏﹏﹏﹏﹏﹏﹏﹏﹏﹏

Обработка и анализ данных – важнейшая часть работы специалиста по системному анализу. В этом может помочь Pandas — программная высокоуровневая библиотека, написанная на Python. Главными структурами данных в ней являются Series и DataFrame. Не понимая их работу, выполнить качественный анализ будет невозможно. Сегодня поговорим про Series.

Series — объект, напоминающий одномерный массив (к примеру, список в Python). Отличительная черта — ассоциированные метки или так называемые индексы, расположенные, вдоль каждого элемента списка. Это особенность и превращает Series в ассоциативный массив либо словарь в Python.

-2

В строковом представлении Series индекс находится слева, а элемент справа. Если же индекс не задан явно, pandas автоматически создаст RangeIndex от 0 до N-1, где N — общее число элементов. Кроме того, следует учесть, что в Series существует тип хранимых элементов (в примере это int64, ведь мы передавали целочисленные значения).

Также у объекта Series есть атрибуты, посредством которых вы сможете получить список элементов и индексы — values и index соответственно.

-3
-4

-5

Также есть возможность осуществлять выборку по нескольким индексам и выполнять групповое присваивание:

-6

Что касается фильтрации, то это тоже не проблема для Series, плюс можно применять математические операции и т. д.:

-7

Но если сам объект Series напоминает словарь, где ключ — это индекс, а значение — сам элемент, то мы можем сделать следующее:

-8

У объекта Series и его индекса присутствует атрибут name, который задает имя объекту и индексу.

-9

Индекс мы можем поменять без проблем, присвоив список атрибуту index объекта Series.

-10

Также имейте в виду, что список с индексами по длине в обязательном порядке должен совпадать с числом элементов в Series.

По материалам блога https://khashtamov.com/ru/.