Найти в Дзене
Анализ данных в Pandas

Анализ данных в Pandas

Канал о инструментах и методах анализа данных с использованием Python и Pandas
подборка · 6 материалов
9 месяцев назад
Pandas. Загрузка данных из Google sheets.
Многие компании сейчас ведут расчеты не в Excel, а в Google Sheets (Гугл таблицы). Это удобный и главное бесплатный способ ведения учета и расчетов. Таблицы Google Sheets позволяют работать над одной таблицей нескольким пользователям, онлайн, из любой точки мира, нужен только доступ в интернет. Еще такой способ сбора и обработки данных интересен тем, что один раз настроив загрузку и обработку таблицы в Google Sheets, при каждом обновлении данных нет необходимости копировать и сохранять файл с новыми данными...
9 месяцев назад
Pandas. Загрузка данных из CSV.
Для загрузки данных из учетных систем часто используется формат CSV. CSV довольно распространенный формат для импорта/экспорта данных между различными приложениями Формат CSV (comma-separated values — «значения, разделённые запятыми») широко используется для импорта и экспорта данных между различными приложениями. Это текстовый формат, который позволяет хранить табличные данные: каждая строка таблицы соответствует строке текста, а поля разделяются специальным символом-разделителем, чаще всего запятой или точкой с запятой...
10 месяцев назад
Pandas. Загрузка данных из Excel.
Для проведения анализа данные необходимо откуда-то получить. Источником данных может выступать бухгалтерская программа, к примеру 1С или данные управленческого учета. При отсутствии специальных коннекторов к бухгалтерской программе или грамотного программиста 1С, самым простым и быстрым способом получить данные, будет выгрузить их в Excel. Excel также является универсальным форматом экспорта данных и в других системах учета и сбора данных. Pandas дает возможность загружать данные из Excel попутно обрабатывая и распознавая формат этих данных...
10 месяцев назад
Представление данных в Pandas
Данные в pandas могут быть представлены в виде двух основных сущностей. Это два разных вида представления данных, но на самом деле один из этих типов - Датафрейм просто состоит из нескольких наборов данных другого вида - Серий. Series (Серия) - это ряд данных - [1, 2, 3, 22, 24, 2,] или одномерный массив данных с привязанными метками. Наиболее близко по смыслу сравнение с данными отраженными в одном столбце Excel, но есть существенное различие, каждая единица данных имеет свою метку - индекс. При отображении Series индекс всегда будет находиться слева, а его значения справа...
10 месяцев назад
Установка Anaconda Navigator и Jupyter lab
Для анализа данных на Python, достаточно установить Python и уже в нем с помощью pip загрузить необходимые библиотеки для анализа данных. Однако для новичка не знакомого хорошо с Python, это будет сложновато. Есть простое и бесплатное решение. На сегодняшний день, для анализа данных существует большое количество программных сред, которые сильно упрощают и облегчают работу по написанию кода и дальнейшего проведения анализа. Одним из лучших инструментов в сфере анализа данных считается Jupyter. Изначально это был Jupyter Notebook...
10 месяцев назад
Не хватает возможностей Excel? Возьмите Pandas!
Если вы серьезно работаете с данными, то вы наверняка что то слышали о анализе данных на Python (Пайтон) и библиотеке Pandas (Пандас). Для справедливости нужно сказать, что анализ данных на сегодняшний день ведется не только на Python. Используются и другие языки программирования, но в данном канале мы изучаем только Python. В чем огромное преимущество проведения анализа и обработки данных на языке Python по сравнению с Excel? Вы не ограничены стандартными формулами, графиками и функционалом Excel...