137 читали · 4 года назад
Sample в Статистике простыми словами
Выборка (сэмпл) – часть Cовокупности (Population), подмножество точек ее данных. Процесс получения набора сэмплов называют Сэмплингом (Sampling). Первый шаг статистического анализа – определить, является ли набор данных, с которым Вы имеете дело, генеральной совокупностью или Выборкой. Совокупность – это набор всех элементов, представляющих интерес для вашего исследования. Совокупность vs. Выборка Совокупность – это наблюдаемые нами объекты: люди, события, животные и т.д. У нее есть некоторые параметры,...
pandas_profiling в Машинном обучении простыми словами
Профайлер Pandas (pandas_profiling) – библиотека для создания статистического отчета о Датафрейме (DataFrame). На момент создания статьи определяет: А также строит графики: Пример Чтобы установить какой-то внешний модуль, а профайлер Pandas к ним относится, используют специальную команду: Теперь его можно импортировать, как и любую другую библиотеку, директивой import: Итак, мы возьмем набор данных о потребителях банковских кредитных продуктов: Создадим датафрейм из csv-файла. Наш набор выглядит вот так: Запросим расширенную статистическую аналитику...