Хирьянов Т.Ф. - Основы программирования и анализа данных на Python - 8. Статистический анализ
20 эффективных статистических методов в анализе данных
Статистические методы, представленные в этой статье, довольно удобны и могут быть использованы для лёгкого изучения любого сложного датасета. Статистический анализ – это одна из самых мощных техник, используемых для поиска скрытых паттернов в данных. Он широко используется для предсказания погоды, возможного оттока клиентов, тонального анализа и многого другого. Вследствие технологических достижений обозначился повышенный спрос на математиков-статистиков. Статистика позволяет извлекать неочевидные...
Статистические примитивы с Python
Прокачаем знание методов получения ключевых статистик средствами Pandas. В последующем на их базе как на строительных блоках возводится здание для более основательного анализа. В демонстрационных целях будем использовать датасет о цветках Ириса, который получим с помощью библиотеки Scikit-learn: Среднее, стандартное отклонение, дисперсия Данные величины выводятся методами mean, std и var библиотеки Pandas: При этом число степеней свободы для подсчета стандартного отклонения и дисперсии регулируется параметром ddof...