348 подписчиков
@just_data_science October 29, 2017 Прежде чем ознакомиться с более традиционными методами машинного обучения, появившимися до повального увлечения нейронками, нужно немного уйти в математику. Ненадолго, только чтобы уточнить, что все методы обучения решают два типа задач: классификации и регрессии. Какие-то методы машинного обучения способны работать с обоими типами задач, какие-то - только с одним. Регрессия вызывает агрессию? Вызывает, если у вас на экзамене билет про Регрессионный анализ, и вы пытаетесь вспомнить все эти многостраничные математические формулы...
6 лет назад
233 подписчика
Регрессия - это метод статистического анализа, используемый в машинном обучении для предсказания числовых значений на основе зависимостей между переменными.

Регрессия - одно из базовых понятий в статистике.

Идея регрессии заключается в том, чтобы найти математическую связь между независимой переменной (предиктором) и зависимой переменной (предсказываемой).

В регрессии строится модель, которая пытается приблизить зависимую переменную с помощью одной или нескольких независимых переменных.

Модель представляется уравнением, которое может использоваться для предсказания значений зависимой переменной на основе известных значений независимых переменных.

Виды регрессии:
🔹 Простая линейная регрессия
🔹 Множественная линейная регрессия
🔹 Нелинейная регрессия

Для простоты мы рассмотрим первый тип - линейную регрессию.

Мы подразумеваем, что одна величина зависит от другой. Зависимость представляет собой прямую линию на графике.

Математически это представляется уравнением вида: y = mx + b,

где y - зависимая переменная,
x - независимая переменная,
m - коэффициент наклона (slope) и b - свободный член (intercept).

Из школьной курса математики известно, что коэффициент m отвечает за угол наклона нашей прямой, а свободный член - за смещение линии вправо или влево относительно оси ординат (Y).

Задачи регрессии могут включать прогнозирование цен на недвижимость, дохода, продаж и др.

Целью регрессии является минимизация разницы между предсказанными значениями и реальными данными.

Ошибку между прогнозными значениями и реальными данными можно рассчитать при помощи метода наименьших квадратов (MSE). Мы писали об этом здесь.

Выводы:
Необязательно использовать сложные Deep Learning модели для решения задач прогнозирования. Если детальная точность не так важна, то линейная регрессия прекрасно справляется с этой задачей.

11 месяцев назад