Дойдя до этой темы, я не нашёл чёткого, простого и понятного объяснения. Так я решил написать эту статью. Постарался написать простым понятным языком. Техники дифференцирования матриц активно применяются в машинном обучении и оптимизации, поэтому важно понимать как это делать. Это сильно упрощает жизнь при вычислениях, например, если мы хотим продифференцировать некоторую функцию которая состоит из матриц и векторов, не опытный пользователь начнёт расписывать через суммы и, исходя из условий, пытаться дифференцировать по нужной переменной. Но это сложный путь, путь который предлагает техника матричного дифференцирования проще. Что стоит знать: Далее будем обозначать так: Все векторы по умолчанию считаются столбцами. Рассмотрим функцию f(x): Rⁿ -> R (это значит что на вход принимает вектор, а на выходе получается обычное вещественное число) Попробуем найти производную по x1: Что будем делать? Попробуем расписать как сумму и найти производную: Если не совсем понятно почему сумма именно