Теория игр и критерии оценки рискованности решения

Теория игр – это математическая теория конфликтных ситуаций. Задача этой теории – выработка рекомендаций по рациональному образу действий участников конфликта. При этом строят упрощенную модель конфликтной ситуации, называемую игрой. Под "игрой" понимают мероприятие, состоящее из ряда действий или "ходов". От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Стороны, участвующие в конфликте, называют "игроками", исход конфликта – "выигрышем" и т.д.

Если в игре сталкиваются интересы двух сторон, то игра называется парной, если сторон больше – множественной. Множественная игра с двумя постоянными коалициями обращает игру в парную. Наибольшее практическое значение имеют парные игры.

Для обеспечения возможности математического анализа игры должны быть:

1) правила игры;

2) система условий, регламентирующая:

· возможные варианты действий игроков;

· объем информации каждой стороны о поведении другой;

· результат (исход) игры, к которому приводит каждая данная совокупность ходов.

Игра называется игрой с нулевой суммой, если один игрок выигрывает ровно столько, сколько проигрывает другой, то есть сумма выигрышей равна нулю. В игре с нулевой суммой интересы противников прямо противоположны.

Обозначим буквой а выигрыш игрока А, а буквой b – выигрыш игрока B в игре с нулевой суммой.

Так как, а = -b , то при анализе такой игры нет необходимости рассматривать оба эти числа, а достаточно рассматривать выигрыш одного из игроков, пусть это будет - игрок А.

Развитие игры во времени представляется рядом последовательных этапов или "ходов".

Ходом в теории игр называют выбор одного из предусмотренных правилами игры действий и его осуществление. Ходы бывают личные и случайные.

Личным ходом называется сознательный выбор игроком одного из возможных вариантов действий и его осуществление. Случайным ходом называют выбор из ряда возможностей, осуществляемый не игроком, а каким-либо механизмом случайного выбора (например, бросанием монеты и др.). Для каждого случайного хода правила игры определяют распределение вероятностей возможных исходов.

Теория игр занимается анализом только тех игр, которые содержат личные ходы. Такие игры строятся на основании стратегий игрока.

Стратегией игрока называют совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в ходе игры. В зависимости от числа возможных стратегий игры делятся на "конечные" и "бесконечные".

Игра называется конечной, если у каждого игрока имеется только конечное число стратегий, и бесконечной, если хотя бы у одного из игроков имеется бесконечное число стратегий.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что то же самое, минимально возможный средний проигрыш).

При выборе оптимальной стратегии основой рассуждении является предположение, что противник по меньшей мере так же разумен, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели.

В теории игр не учитываются неизбежные в каждой конфликтной ситуации:

· просчеты и ошибки игроков;

· риск и азарт.

Кроме того важнейшим из ограничений математической теории игр является то, что выигрыш искусственно сводится к одному единственному числу (реально – это некоторый набор параметров эффекта: завоевание большей доли рынка, рост престижа марки и т.д.). Стратегия, оптимальная по одному показателю, необязательно будет оптимальной по другим.

Модель игры. Рассматривают конечную игру, в которой игрок А имеет m стратегий, а игрок В имеет n стратегий. Такая игра называется игрой m х n. Стратегии, соответственно, обозначим: A1, A2, ..., Am – для игрока A; B1, B2, ..., Bn – для игрока В. Если игра состоит только из личных ходов, то выбор стратегий Ai и Bj игроками однозначно определяет исход игры – наш выигрыш аij. Если известны aij для всех сочетаний стратегий, то они образуют платежную матрицу размером m х n, где: m – число строк матрицы, а n – число его столбцов.

Платёжная матрица

Предлагаемые стратегии игрока А Стратегии игрока В
В1 В2 Вj Вn
Стратегия A1 a11 a12 a1j a1m
Стратегия A2 a21 a22 a2j a2m
Стратегия Ai ai1 ai2 aij aim
 
Стратегия Am am1 am2 amj amn

 

Нижняя и верхняя цена игры. Поставим задачу: определить наилучшую среди наших стратегий A1, A2 , ..., Am. Условимся рассматривать только чистые стратегии. Затем проанализируем последовательно каждую из них от A1 до Am. Выбирая Ai, мы должны рассчитывать, что противник ответит на нее той из стратегий Bj, для которой наш выигрыш минимален.

Найдем минимальноеиз чиселаij в i-той строкеи обозначим егоai:

Естественно, что осторожный игрок должен выбрать ту стратегию, для которой число ai максимально. Обозначим это максимальное значение a:

а принимая во внимание формулу для ai, можно записать:

.

Величина a называется нижней ценой игры, максиминным выигрышем или максимином. Соответствующая стратегия называется максиминной стратегией.

Очевидно, что аналогичное рассуждение можно провести и за сторону В. Эта сторона заинтересована в том, чтобы обратить наш выигрыш в минимум, то есть максимизировать свой выигрыш. Поэтому будут выделены максимальные значения выигрыша по столбцам:

.

Затем ищут минимальное значение bj:

 

или .

Величина b называется верхней ценой игры, иначе – минимаксным выигрышем или минимаксом.Соответствующая выигрышу b стратегия называется его минимаксной стратегией.

Принцип осторожности,диктующий игрокам выбор соответствующих стратегий(максиминной и минимаксной),является в теории игр основным принципом иназывается принципом минимакса.

1. Критерий Вальда (наибольшая осторожность) - «рассчитывай на худшее» или критерий крайнего пессимизма - называют критерий, предписывающий обеспечить значение параметра эффекта, равного α.

На основе данных платёжной матрицы определяются максиминные оценки стратегий, показывающие гарантированный максимальный выигрыш в наихудших условиях, т.е.:

Платёжная матрица дополненная столбцом ММ-критерия

Предлагаемые стратегии игрока А Стратегии игрока В ММ-критерий
В1 В2 Вj Вn
Стратегия A1 a11 a12 a1j a1m W1 = minj a1j
Стратегия A2 a21 a22 a2j a2m W2 = minj a2j
Стратегия Ai ai1 ai2 aij aim Wi = minj aij
Стратегия Am am1 am2 amj amn Wm = minj amj

Этот критерий ориентирует лицо, принимающее решение, на наихудшие условия и рекомендует выбрать ту стратегию, для который выигрыш максимален. В других, более благоприятных условиях использование этого критерия приводит к потере эффективности системы или операции.

Выбранная таким образом стратегия полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать ММ-критерий одним из фундаментальных.

Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:

· о возможности появления состояний окружающей среды ничего не известно;

· решение реализуется только один раз;

· необходимо исключить какой бы то ни было риск.

 

2. Критерий Сэвиджа (минимизация большого риска) «рассчитывай на лучшее».