Исследовательский анализ данных Найти все уникальные значения (то есть без повторов) можно специальным методом unique() из библиотеки pandas. Он выведет перечень уникальных значений в столбце State. Считать значения вручную тоже не придётся — для этого есть метод nunique(). Он выведет количество уникальных значений в столбце. Что делать, если мы хотим отобрать данные за определённый год, но порядковых номеров не знаем? Выход — добавить условие. Такой приём в pandas называют логической индексацией. Покажем на практике. Выберем все значения из столбца Production, для которых год (столбец Year) равен 2018: Данные по всем штатам. Агрегированные данные Объединить данные в такие группы поможет метод groupby() из библиотеки pandas. Метод groupby() чаще всего сочетают с другими командами, например, с sum() — этот метод посчитает сумму значений в каждой группе. Модель предсказания Сдвинуть столбец на одно значение вперёд поможет метод shift(). Он сдвигает значения в столбце на указанное колич
День 179. Основы анализа данных и Python. Машинное обучение и Data Science.
11 мая 202511 мая 2025
1
1 мин