Data Science пример задачи кредитного скоринга / Урок построения модели ML на python
Boxplot и с чем его едят
Картинка выше это boxplot (ящик с усами). Boxplot - это удобный способ изобразить распределение данных, используя всего 5 метрик: 1. «Минимум» = Q1 - 1.5 * IQR 2. Первый квартиль (Q1) 3. Медиана 4. Третий квартиль (Q3) 5. «Максимум» = Q3 + 1.5 * IQR По графику сразу можно понять выбросы (outliers), симметричен ли дата-сет, как плотно лежат значения и как скошено распределение. Обратите внимание, что для ящика с усами «минимум» и «максимум» не являются минимальным и максимальным значением, а лишь помогают определить выбросы...
Pandas Python что это
😎Что такое Pandas и чем же он так хорош? Pandas — это Python-библиотека для обработки и анализа структурированных данных, её название происходит от «panel data» («панельные данные»). Панельными данными называют информацию, полученную в результате исследований и структурированную в виде таблиц. Для работы с такими массивами данных в Python создана библиотека Pandas. В основе данной библиотеки лежит DataFrame – структура данных табличного типа. Любое табличное представление данных, например, электронные таблицы или базы данных, можно использовать как DataFrame. Объект DataFrame составлен из объектов типа Series — одномерных массивов, которые объединены под одним названием и типом данных...
Топ-50 курсов Python Pandas
Pandas — это одна из самых известных библиотек для языка Python, которая предоставляет разработчикам новые инструменты для работы с данными: их обработки и анализа. В этой подборке мы предлагаем вам ознакомиться с лучшими онлайн-курсами для начинающих по использованию Pandas. Преподаватели расскажут вам о правильной установке библиотеки, основных и продвинутых инструментах Pandas, арифметических операциях с данными, создании многомерных массивов и использовании функций. Если вам нужен эффективный...