Найти тему

15. Математические методы принятия решений

Это отрывок из моей книжки "Методы принятия решений". Если кого-то заинтересует, могу выслать электронную копию. Вот её обложка:

Рис.1. Карикатура на обложке О.Е. Дудник
Рис.1. Карикатура на обложке О.Е. Дудник

1.1. Постановка задачи и основные определения

Матожидание -оценка среднего, полученная по известной функции распределения вероятностей. Это ожидаемое, предвосхищаемое значение среднего.

Риск - это матожидание потерь.

С помощью сравнения матожиданий принимают решения при выдаче кредитов в банках, а также при управлении запасами в торговых точках.

Будем полагать, что лицо, принимающее решение (ЛПР), имеет возможность выбора из вариантов своих действий а1, а2 … аm. В ответ некий противник выдает одну из своих возможных n реакций. Допустим, ЛПР выбрало i–е действие и получило в ответ j-ю реакцию. Совместными действиями ЛПР и его противника порождается ситуация, характеризуемая для ЛПР полезностью. Когда значение полезности отрицательно, оно называется антиполезностью или вредом. Будем также полагать, что ЛПР не знает определённо, какой ответ выберет противник, но вероятности реакций противника могут быть или известны, или частично известны, или же эти вероятности могут быть совсем неизвестны. Задача состоит в том, чтобы выработать для ЛПР правила отбора вариантов на основе анализа матрицы полезностей . Правила отбора вариантов принято называть критериями принятия решений(КПР).

Классификация противников. Противник, не стремящийся уменьшить выигрыш или увеличить проигрыш лица, принимающего решение, называется равнодушным противником. В роли равнодушного противника обычно выступает природа. Противника, который стремится уменьшить выгоду лица, принимающего решение, чтобы увеличить собственную, естественно называть конкурентом.

И наконец, враг – это тот, кто стремится не только уменьшить выгоду противника, но и увеличить его потери даже ценой собственных потерь.

Определение стратегии. Последовательное использование какого-либо определенного КПР или определенного набора КПР в серии принимаемых решений будем называть стратегией.

1.2. Наиболее известные стратегии

Итак, представление задачи о принятии решения сводится к тому, что ЛПР выбирает строку в матрице полезности, которая представляет собой "как бы меню" из возможных ответов противника. После того как ЛПР выбрал строку, противник с какой-то вероятностью «преподносит» ему нечто из этого меню, но обязательно что-то одно, характеризуемое конкретным значением полезности .

Рис.2. Матрица полезностей. Столбцы соответствуют ответам противника, а строки - выбору ЛПР.
Рис.2. Матрица полезностей. Столбцы соответствуют ответам противника, а строки - выбору ЛПР.

Стратегия Пессимиста. Человек, который не верит в свою удачу, последовательно, раз за разом, выбирает строку, содержащую минимальный из всех возможных проигрышей. Он как бы говорит себе: «Все равно я проиграю, так пусть мой проигрыш будет как можно меньше».

Процедура выбора содержит следующие этапы:

а) ищется минимум в каждой строке:

б) ищется та строка, которая содержит элемент, максимальный из всех значений минимальных полезностей. Иначе эта стратегия называется стратегией максимина.

Стратегия Авантюриста. Авантюрист безрассудно верит в свою удачу. Он последовательно, раз за разом выбирает строку, содержащую максимальный из возможных выигрышей, в надежде, что именно он-то ему и выпадет, и ему обязательно удастся «сорвать куш». Процедура выбора содержит следующие этапы:

а) ищется максимум в каждой строке

б) ищется та строка, которая содержит самый большой максимум.

Допустим, он содержится в l-й строке. Значит, Авантюрист отдаст предпочтение действию, соответствующему этой строке матрицы.

Стратегия Рационалиста. Рационалист отдает себе отчет в том, что он рискует, осуществляя выбор, и потому неизменно выбирает строку, в которой максимально математическое ожидание выигрыша. Процедура выбора содержит этапы:

а) для каждой строки составляется сумма матожиданий полезностей.

б) далее ищется строка, для которой матожидание полезностей максимально.

Допустим, оно максимально в r-й строке. Значит Рационалист отдает предпочтение действию, соответствующему r-й строке матрицы. Это есть решение, принятое на основе сравнения матожиданий. С помощью сравнения матожиданий принимают решения при выдаче кредитов в банках, а также при управлении запасами в торговых точках.

Стратегия Сэвиджа(Savage). Она состоит в последовательном применении критерия Сэвиджа.

По критерию Сэвиджа мы выбираем именно ту альтернативу, в которой минимизируются максимальные дополнительные, по сравнению с оптимальным выбором, потери. Можно сказать, что это «стратегия утешения». Если человек, используя стратегию Сэвиджа, не взял главный приз, то он, по крайней мере, выходит из игры с сознанием того, что его разочарование не самое большое из всех возможных.

Стратегия Гермейера. Она опирается на критерий Гермейера. В каждой строке ищется ответ противника с минимальным матожиданием.

Затем выбирается альтернатива, дающая дающая наибольшее из наименьших матожиданий, иначе: наилучшее из худших матожиданий. Важно! Когда вероятности одинаковы (равномерно распределены), критерий Гермейера идентичен минимаксному, то есть равнозначен стратегии Пессимиста.

Возникает вопрос: когда какая стратегия предпочтительней?

Ответы содержатся в структуре матриц U и Р. Если в матрице U много отрицательных больших по модулю элементов, а в матрице Р все вероятности примерно равны или неизвестны, то предпочтительна стратегия Пессимиста. Если же отрицательных элементов нет, то лучше стратегия Авантюриста.

Когда вероятности хорошо известны, потери не могут быть фатальными и решения принимаются многократно, то следует использовать стратегию Рационалиста.

Параметр доверия n можно оценивать по дисперсиям оценок элементов матрицы вероятностей, предложенных различными экспертами.

Уровень пессимизма с можно оценить, сравнив по модулю суммарные положительные и отрицательные элементы матрицы полезностей.

Однако следует заметить, что знание стратегии не означает, что человек ею пользуется: знание техники плавания не тождественно умению плавать.

Примечание. В этой статье опущены формулы.