Регрессия - это метод статистического анализа, используемый в машинном обучении для предсказания числовых значений на основе зависимостей между переменными. Регрессия - одно из базовых понятий в статистике. Идея регрессии заключается в том, чтобы найти математическую связь между независимой переменной (предиктором) и зависимой переменной (предсказываемой). В регрессии строится модель, которая пытается приблизить зависимую переменную с помощью одной или нескольких независимых переменных. Модель представляется уравнением, которое может использоваться для предсказания значений зависимой переменной на основе известных значений независимых переменных. Виды регрессии: 🔹 Простая линейная регрессия 🔹 Множественная линейная регрессия 🔹 Нелинейная регрессия Для простоты мы рассмотрим первый тип - линейную регрессию. Мы подразумеваем, что одна величина зависит от другой. Зависимость представляет собой прямую линию на графике. Математически это представляется уравнением вида: y = mx + b, где y - зависимая переменная, x - независимая переменная, m - коэффициент наклона (slope) и b - свободный член (intercept). Из школьной курса математики известно, что коэффициент m отвечает за угол наклона нашей прямой, а свободный член - за смещение линии вправо или влево относительно оси ординат (Y). Задачи регрессии могут включать прогнозирование цен на недвижимость, дохода, продаж и др. Целью регрессии является минимизация разницы между предсказанными значениями и реальными данными. Ошибку между прогнозными значениями и реальными данными можно рассчитать при помощи метода наименьших квадратов (MSE). Мы писали об этом здесь. Выводы: Необязательно использовать сложные Deep Learning модели для решения задач прогнозирования. Если детальная точность не так важна, то линейная регрессия прекрасно справляется с этой задачей. 👉 @aisimple
Важную роль при исследовании взаимосвязей между статистическими выборками кроме корреляционного и дисперсионного анализа играет регрессионный анализ. Регрессия позволяет проанализировать воздействие на какую-либо зависимую переменную одной или более независимых переменных и позволяет установить аналитическую форму (модель) этой зависимости в виде аппроксимирующего полинома. Если рассматривается зависимость между одной зависимой переменной Y и несколькими независимыми то речь идет о множественной линейной регрессии...