Для оценки качества линейных регрессионных моделей часто используется средняя квадратичная ошибка (MSE). Она измеряет среднее значение квадратов ошибок — то есть среднюю квадратичную разницу между оценёнными значениями и фактическим значением, является функцией потерь. Разберём задачу, загрузим данные и изучим признаки. Загрузите данные из файла flights.csv. Напечатайте на экране: import pandas as pd
data = pd.read_csv('/datasets/flights.csv')
print(data.shape)
print(data.head(5)) Преобразуйте категориальный признак техникой OHE, избегайте дамми-ловушки. Приведите численные признаки к одному масштабу. import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
data = pd.read_csv('/datasets/flights.csv')
data_ohe=pd.get_dummies(data, drop_first=True)
target = data_ohe['Arrival Delay']
features = data_ohe.drop(['Arrival Delay'] , axis=1)
features_train, features_valid, target_train, target_valid = train_test_split(
fe