Введение. Уравнение Беллмана предлагает метод решения стохастических оптимальных задач управления, подобно Марковскому процессу принятия решений. Марковский процесс принятия решений (МППР) представляет собой дискретный процесс стохастического контроля времени. На каждом этапе процесс находится в том или ином штате, и лицо, принимающее решения, может выбрать действие в этом штате. Вероятность перехода процесса в новое состояние зависит от выбранного агентом действия, характеризующегося переходной функцией "государства"...
Да, снова статья по мотивам комментария одного читателя, на сей раз к статье Читатель с ником "Злой гений" написал довольно оскорбительный комментарий. Привожу его дословно: "Автор ты ламер! """ ключевому режиму"" нет таких режимов. Есть ипульсный режим. Что за неучи пишут? Нахватаются верхушек, и строят из себя спецов. Ты еще скажи про "" ламповые ключи"" ))" Уж не знаю, насколько он "Злой", но вот до "гения" ему точно очень далеко, хоть он и считает себя умнее всех. За откровенное хамство он был заблокирован, но вот "отсутствие ключевого режима" я решил разобрать немного подробнее...