Если представить себе шкалу от плохого к хорошему как некоторую функцию, то можно представить, что у нас есть целевая функция, которую мы стремимся минимизировать или максимизировать - в зависимости от того, как мы определяем "хорошее". Векторами в данном случае могут быть значения параметров, которые подбираются и обновляются в процессе обучения модели. Градиенты этой функции отражают, как параметры влияют на ее значение и какие изменения в параметрах приведут к наибольшему уменьшению (или увеличению) функции потерь. Интересный момент: если мы минимизируем функцию потерь, то градиент будет указывать в направлении уменьшения потерь, то есть в сторону "лучше". Если функцию потерь максимизируем - градиент будет указывать в направлении увеличения функции, то есть "плохого". Таким образом, градиенты указывают на ту стратегию обновления параметров, которая приближает нас к желаемой шкале от "плохого" к "хорошему". Когда мы говорим о шкале от плохого к хорошему в контексте машинного обучения
Шкала "плохого" и "хорошего" в машинном обучении
12 июня 202412 июн 2024
1
1 мин