13,7K подписчиков
Источник: Nuances of Programming Алгоритмы машинного обучения делятся на контролируемые и неконтролируемые. Алгоритмы контролируемого обучения моделируют отношения между помеченными входными и выходными данными (также известными как целевые данные). Впоследствии такая модель используется для предсказания метки новых наблюдений с помощью новых помеченных входных данных. Если целевая переменная дискретная, алгоритм решает задачи классификации, а если целевая переменная непрерывная  —  алгоритм используется для задач регрессии...
1 год назад
233 подписчика
Регрессия - это метод статистического анализа, используемый в машинном обучении для предсказания числовых значений на основе зависимостей между переменными.

Регрессия - одно из базовых понятий в статистике.

Идея регрессии заключается в том, чтобы найти математическую связь между независимой переменной (предиктором) и зависимой переменной (предсказываемой).

В регрессии строится модель, которая пытается приблизить зависимую переменную с помощью одной или нескольких независимых переменных.

Модель представляется уравнением, которое может использоваться для предсказания значений зависимой переменной на основе известных значений независимых переменных.

Виды регрессии:
🔹 Простая линейная регрессия
🔹 Множественная линейная регрессия
🔹 Нелинейная регрессия

Для простоты мы рассмотрим первый тип - линейную регрессию.

Мы подразумеваем, что одна величина зависит от другой. Зависимость представляет собой прямую линию на графике.

Математически это представляется уравнением вида: y = mx + b,

где y - зависимая переменная,
x - независимая переменная,
m - коэффициент наклона (slope) и b - свободный член (intercept).

Из школьной курса математики известно, что коэффициент m отвечает за угол наклона нашей прямой, а свободный член - за смещение линии вправо или влево относительно оси ординат (Y).

Задачи регрессии могут включать прогнозирование цен на недвижимость, дохода, продаж и др.

Целью регрессии является минимизация разницы между предсказанными значениями и реальными данными.

Ошибку между прогнозными значениями и реальными данными можно рассчитать при помощи метода наименьших квадратов (MSE). Мы писали об этом здесь.

Выводы:
Необязательно использовать сложные Deep Learning модели для решения задач прогнозирования. Если детальная точность не так важна, то линейная регрессия прекрасно справляется с этой задачей.

11 месяцев назад
595 подписчиков
Логистическая регрессия (LogReg) – это алгоритм классификации, используемый для отнесения наблюдений к дискретному набору классов. В отличие от Линейной регрессии (Linear Regression), которая выводит непрерывные числовые значения, LogReg преобразует свой вывод с помощью Сигмоида (Sigmoid), чтобы вернуть значение вероятности, которое затем может быть округлено в сторону одного из дискретных классов: Логистическая регрессия и Scikit-learn Натренируем Нейронную сеть (Neural Network), предсказывающую, согласится ли клиент банка взять кредит...
3 года назад