Найти в Дзене
iPavlov.ai

Зачем вообще обучать машины?

Возьмем жизненную ситуацию: человек хочет купить машину за 1 млн рублей. Он заходит на сайт, где еще нет фильтров по цене, и перебирает объявления. В процессе сбора данных он выясняет, что новые машины в среднем стоят 2 млн, годовалые — 1,9 млн., двухгодовалые — 1,8 млн. и так далее. С каждым годом жизни машины цена снижается на 100 000 рублей. Человек приходит к выводу, что с его бюджетом ему светит что-то примерно десятилетнее.

То, что сделал человек, собрав данные и обобщив до формулы, в статистическом анализе называется регрессией. Регрессия позволяет связать между собой некие числовые параметры, и используется, чтобы предсказывать, какое значение будет у параметра А при определенном значении параметра Б. Не задумываясь, мы регулярно пользуемся рудиментарными формами регрессионного анализа в повседневной жизни. Например, организуя шашлыки на майских, можно пойти сложным путем и опросить двадцать человек, на кого сколько мяса брать. А можно просто взять среднее потребление, 0,5 кг на человека в сутки, и закупить сразу 10 кг, не засоряя чат.

ipavlov.ai
ipavlov.ai

Простые формулы дают удобство. Но в большинстве ситуаций параметров не два и не три, а гораздо больше. Взять те же машины: помимо года выпуска есть пробег, модель, комплектация, техническое состояние, сезонность спроса и так далее. Даже по отдельности связать все варианты, с той же ценой по очереди — это уже выходит за рамки того, что удобно посчитать в уме. А ведь эти параметры еще и между собой взаимодействуют, причем не всегда очевидным образом. Здесь на помощь и приходит машинное обучение 💻