Тема 15. Игры в условиях неопределенности. Критерий принятия решений

Пусть в игре с природой П игрок А обладает т возможными чистыми стратегиями, а природа П может находиться в одном из п состояний . Пусть (22.1) является матрицей выигрышей игрока А.

Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами.

Переставим выигрыши при каждой стратегии (т. е. элементы каждой строки матрицы (22.1)), расположив их в неубывающем порядке, и обозначим элементы полученной матрицы через , а саму матрицу - через В:

B=

. (15.1)

Каждая строка матрицы В является перестановкой выигрышей при стратегии . Не исключена возможность, что для некоторых номеров и будет иметь место равенство. В силу неравенств (23.1) в первом столбце матрицы В стоят минимальные выигрыши при каждой стратегии

, (15.2)

а в последнем -м столбце - максимальные выигрыши при каждой стратегии

. (15.3)

Пусть числа удовлетворяют условиям

и . (15.4)

Показателем эффективности стратегии по рассматриваемому критерию назовем число

. (15.5)

Из этого определения видно, что показатель эффективности стратегии учитывает все выигрыши при этой стратегии и зависит от чисел , удовлетворяющих условиям (15.4).

Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами , назовем критерий, по которому оптимальной среди чистых стратегий считается стратегия с максимальным показателем эффективности (15.5), т.е.

Числа

и (15.6)

назовем показателями соответственно пессимизма и оптимизма. В обозначениях (15.6) индекс - первая буква английского pessimism, индекс "о" - первая буква английского optimism, а - целая часть числа , т. е. наибольшее целое число, не превосходящее числа ; очевидно, что

Коэффициенты выбираются из субъективных соображений следующим образом: чем опаснее ситуация, тем больше возтникает желание в ней подстраховаться, тем больше, т. е. ближе к единице, должен быть коэффициент пессимизма (см. (15.6)) и, следовательно, тем меньше, т.е. ближе к нулю, будет коэффициент оптимизма . В безопасной ситуации коэффициенты выбираются так, чтобы показатель пессимизма был ближе к нулю, а показатель оптимизма - ближе к единице. Таким образом, показатели пессимизма и оптимизма в данном критерии выражают количественную меру соответственно пессимизма и оптимизма игрока А, выбирающего коэффициенты .

Если показатель оптимизма и, следовательно, показатель пессимизма, то критерий - более "оптимистический", чем "пессимистический"; если, наоборот, показатель оптимизма и, следовательно, показатель пессимизма , то критерий - более "пессимистический", чем "оптимистический"; если же показатели оптимизма и пессимизма равны: , то критерий можно считать реалистическим.

Критерий Вальда (критерий крайнего пессимизма). Критерий Вальда есть частный случай обобщенного критерия Гурвица относительно выигрышей со специальными коэффициентами

. (15.7)

которые, очевидно, удовлетворяют условиям (14.4).

Подставляя значения коэффициентов (15.7) в формулу (15.5) и учитывая (15.2), получим показатель эффективности стратегии по критерию Вальда:

. (15.8)

представляющий собой минимальный выигрыш игрока А при применении им стратегии . Оптимальной среди чистых стратегий по критерию Вальда является, таким образом, стратегия , имеющая максимальный показатель эффективности (15.8):

.

Максимаксный критерий (критерий крайнего оптимизма). Противоположностью критерию Вальда является так называемый максимаксный критерий, представляющий собой также частный случай обобщенного критерия Гурвица относительно выигрышей, когда коэффициенты выбираются следующим образом:

. (15.9)

Тогда оптимальной среди чистых стратегий по максимаксному критерию является стратегия с максимальным показателем эффективности

, (15.10)

т.е. стратегия, максимальный выигрыш при которой максимален среди максимальных выигрышей всех чистых стратегий. По-другому можно сказать, что оптимальной будет та чистая стратегия, при которой (хотя бы) один из выигрышей является максимальным среди выигрышей всех чистых стратегий. Оптимальная по максимаксному критерию стратегия гарантирует игроку А возможность наибольшего выигрыша, равного максимаксу

.

Критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма . Данный критерий является как бы промежуточным между критериями крайнего пессимизма и крайнего оптимизма и представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей с коэффициентами

,

удовлетворяющими, очевидно, условиям (15.4).

Оптимальной же стратегией по этому критерию считается стратегия с максимальным показателем эффективности

.