Представим следующую задачу: у нас есть сведения о студентах, которые посещают продвинутый курс математики (такой, как анализ данных и машинное обучение). Мы хотим предсказать, сколько баллов по математике получат студенты на экзамене в конце курса.
Один из методов машинного обучения, который может быть использовал для решения этой задачи - это регрессия. Регрессия предназначена для предсказания непрерывных числовых значений, вроде оценки по математике. В этой статье мы рассмотрим, что такое регрессия, как она работает, и зачем ее используют в машинном обучении...
Дерево в регрессии обучается аналогично, только предсказывает оно не класс, а число. На практическом примере это будет выглядеть следующим образом. Необходимо import pandas as pd from sklearn.tree import DecisionTreeRegressor from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error df = pd.read_csv('/datasets/train_data.csv') features = df.drop(['last_price'], axis=1) target = df['last_price'] / 1000000 features_train, features_valid, target_train, target_valid = train_test_split( features, target, test_size=0...