Дамми-ловушка - наличие атрибутов с высокой степенью корреляции, которые предсказывают значение друг друга. Чтобы не попасть в такую ловушку, используется аргумент drop_first функции pd.get_dummies(). Задача 1 Преобразуйте колонку техникой OHE. Чтобы не попасть в дамми-ловушку, примените аргумент drop_first функции pd.get_dummies(). Напечатайте первые пять записей изменённой таблицы. import pandas as pd
data = pd.read_csv('/datasets/travel_insurance.csv')
print(pd.get_dummies(data['Gender'], drop_first=True).head(5)) Задача 2 Примените прямое кодирование ко всему датафрейму. Вызовите функцию pd.get_dummies() c аргументом drop_first. Сохраните таблицу в переменной data_ohe. Выведите на экран первые три строки преобразованной таблицы. import pandas as pd
data = pd.read_csv('/datasets/travel_insurance.csv')
print(pd.get_dummies(data, drop_first=True).head(3)) Задача 3 Разбейте исходные данные на две выборки в соотношении 75:25 (%): Объявите четыре переменные и запишите в них: Вам предсто