Тема 15. Игры в условиях неопределенности. Критерий принятия решений
Пусть в игре с природой П игрок А обладает т возможными чистыми стратегиями, а природа П может находиться в одном из п состояний . Пусть (22.1) является матрицей выигрышей игрока А.
Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами.
Переставим выигрыши при каждой стратегии (т. е. элементы каждой строки матрицы (22.1)), расположив их в неубывающем порядке, и обозначим элементы полученной матрицы через , а саму матрицу - через В:
B= | … | ||||
… | |||||
… | |||||
… | … | … | … | … | |
… |
. (15.1)
Каждая строка матрицы В является перестановкой выигрышей при стратегии . Не исключена возможность, что для некоторых номеров и будет иметь место равенство. В силу неравенств (23.1) в первом столбце матрицы В стоят минимальные выигрыши при каждой стратегии
, (15.2)
а в последнем -м столбце - максимальные выигрыши при каждой стратегии
. (15.3)
Пусть числа удовлетворяют условиям
и . (15.4)
Показателем эффективности стратегии по рассматриваемому критерию назовем число
. (15.5)
Из этого определения видно, что показатель эффективности стратегии учитывает все выигрыши при этой стратегии и зависит от чисел , удовлетворяющих условиям (15.4).
Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами , назовем критерий, по которому оптимальной среди чистых стратегий считается стратегия с максимальным показателем эффективности (15.5), т.е.
Числа
и (15.6)
назовем показателями соответственно пессимизма и оптимизма. В обозначениях (15.6) индекс - первая буква английского pessimism, индекс "о" - первая буква английского optimism, а - целая часть числа , т. е. наибольшее целое число, не превосходящее числа ; очевидно, что
Коэффициенты выбираются из субъективных соображений следующим образом: чем опаснее ситуация, тем больше возтникает желание в ней подстраховаться, тем больше, т. е. ближе к единице, должен быть коэффициент пессимизма (см. (15.6)) и, следовательно, тем меньше, т.е. ближе к нулю, будет коэффициент оптимизма . В безопасной ситуации коэффициенты выбираются так, чтобы показатель пессимизма был ближе к нулю, а показатель оптимизма - ближе к единице. Таким образом, показатели пессимизма и оптимизма в данном критерии выражают количественную меру соответственно пессимизма и оптимизма игрока А, выбирающего коэффициенты .
Если показатель оптимизма и, следовательно, показатель пессимизма, то критерий - более "оптимистический", чем "пессимистический"; если, наоборот, показатель оптимизма и, следовательно, показатель пессимизма , то критерий - более "пессимистический", чем "оптимистический"; если же показатели оптимизма и пессимизма равны: , то критерий можно считать реалистическим.
Критерий Вальда (критерий крайнего пессимизма). Критерий Вальда есть частный случай обобщенного критерия Гурвица относительно выигрышей со специальными коэффициентами
. (15.7)
которые, очевидно, удовлетворяют условиям (14.4).
Подставляя значения коэффициентов (15.7) в формулу (15.5) и учитывая (15.2), получим показатель эффективности стратегии по критерию Вальда:
. (15.8)
представляющий собой минимальный выигрыш игрока А при применении им стратегии . Оптимальной среди чистых стратегий по критерию Вальда является, таким образом, стратегия , имеющая максимальный показатель эффективности (15.8):
.
Максимаксный критерий (критерий крайнего оптимизма). Противоположностью критерию Вальда является так называемый максимаксный критерий, представляющий собой также частный случай обобщенного критерия Гурвица относительно выигрышей, когда коэффициенты выбираются следующим образом:
. (15.9)
Тогда оптимальной среди чистых стратегий по максимаксному критерию является стратегия с максимальным показателем эффективности
, (15.10)
т.е. стратегия, максимальный выигрыш при которой максимален среди максимальных выигрышей всех чистых стратегий. По-другому можно сказать, что оптимальной будет та чистая стратегия, при которой (хотя бы) один из выигрышей является максимальным среди выигрышей всех чистых стратегий. Оптимальная по максимаксному критерию стратегия гарантирует игроку А возможность наибольшего выигрыша, равного максимаксу
.
Критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма . Данный критерий является как бы промежуточным между критериями крайнего пессимизма и крайнего оптимизма и представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей с коэффициентами
,
удовлетворяющими, очевидно, условиям (15.4).
Оптимальной же стратегией по этому критерию считается стратегия с максимальным показателем эффективности
.