Существует два основных типа структурированных данных: числовой и категориальный. Числовые данные подразделяются на непрерывные и дискретные. Непрерывныеданные поддерживают арифметические операции и их можно сравнивать между собой. Например, мы можем найти их средние значение. Дискретныеданные, такие как количество событий, можно сравнивать, но арифметические операции над ними не будут иметь смысла. Категориальные данные принимают фиксированные значения. Например, название штата, пол или религия. Особым случаем категориальных данных являются двоичные данные (например, 0 — женский, 1 — мужской). Взаимосвязь этих типов данных можно показать с помощью нескольких основных видов графиков. Для обработки и анализа данных будем использовать библиотеку pandas. 1. Числовые признаки 1.1 Чтобы посмотреть распределение числового признака, принято строить гистограмму. В pandas это команда DataFrame.hist(), где DataFrame – название таблицы структурированных данных. Гистограмма делит все значения по я