Разберемся с ключевым понятием машинного обучения – градиентным спуском. Фактически это способ оптимизации модели путем поиска параметров, минимизирующих функцию стоимости. Последняя является мерой эффективности модели и принимает разные значения в зависимости от задачи, например, для предсказания цены квартиры (см. статью) она может принять следующий вид: В данном случае функция стоимости считает сумму квадратов разности предсказанной и реальной цены по всем примерам. Так как чем сумма меньше, тем прогнозы больше приближаются к реальным, коэффициенты β, минимизирующие данное выражение, будут оптимальными. Они находятся методом градиентного спуска, в основе которого лежит понятие производной. Последняя показывает возрастает или убывает функция в окрестности очередной точки (вектор из параметров). Соответственно, чтобы функция убывала (нам же ее надо минимизировать) необходимо изменять каждый параметр на величину имеющую противоположный знак с производной (производная положительна