Теория игр и критерии оценки рискованности решения

Теория игр – это математическая теория конфликтных ситуаций. Задача этой теории – выработка рекомендаций по рациональному образу действий участников конфликта. При этом строят упрощенную модель конфликтной ситуации, называемую игрой. Под "игрой" понимают мероприятие, состоящее из ряда действий или "ходов". От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Стороны, участвующие в конфликте, называют "игроками", исход конфликта – "выигрышем" и т.д.

Если в игре сталкиваются интересы двух сторон, то игра называется парной, если сторон больше – множественной. Множественная игра с двумя постоянными коалициями обращает игру в парную. Наибольшее практическое значение имеют парные игры.

Для обеспечения возможности математического анализа игры должны быть:

1) правила игры;

2) система условий, регламентирующая:

· возможные варианты действий игроков;

· объем информации каждой стороны о поведении другой;

· результат (исход) игры, к которому приводит каждая данная совокупность ходов.

Игра называется игрой с нулевой суммой, если один игрок выигрывает ровно столько, сколько проигрывает другой, то есть сумма выигрышей равна нулю. В игре с нулевой суммой интересы противников прямо противоположны.

Обозначим буквой а выигрыш игрока А, а буквой b – выигрыш игрока B в игре с нулевой суммой.

Так как, а = -b , то при анализе такой игры нет необходимости рассматривать оба эти числа, а достаточно рассматривать выигрыш одного из игроков, пусть это будет - игрок А.

Развитие игры во времени представляется рядом последовательных этапов или "ходов".

Ходом в теории игр называют выбор одного из предусмотренных правилами игры действий и его осуществление. Ходы бывают личные и случайные.

Личным ходом называется сознательный выбор игроком одного из возможных вариантов действий и его осуществление. Случайным ходом называют выбор из ряда возможностей, осуществляемый не игроком, а каким-либо механизмом случайного выбора (например, бросанием монеты и др.). Для каждого случайного хода правила игры определяют распределение вероятностей возможных исходов.

Теория игр занимается анализом только тех игр, которые содержат личные ходы. Такие игры строятся на основании стратегий игрока.

Стратегией игрока называют совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в ходе игры. В зависимости от числа возможных стратегий игры делятся на "конечные" и "бесконечные".

Игра называется конечной, если у каждого игрока имеется только конечное число стратегий, и бесконечной, если хотя бы у одного из игроков имеется бесконечное число стратегий.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что то же самое, минимально возможный средний проигрыш).

При выборе оптимальной стратегии основой рассуждении является предположение, что противник по меньшей мере так же разумен, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели.

В теории игр не учитываются неизбежные в каждой конфликтной ситуации:

· просчеты и ошибки игроков;

· риск и азарт.

Кроме того важнейшим из ограничений математической теории игр является то, что выигрыш искусственно сводится к одному единственному числу (реально – это некоторый набор параметров эффекта: завоевание большей доли рынка, рост престижа марки и т.д.). Стратегия, оптимальная по одному показателю, необязательно будет оптимальной по другим.

Модель игры. Рассматривают конечную игру, в которой игрок А имеет m стратегий, а игрок В имеет n стратегий. Такая игра называется игрой m х n. Стратегии, соответственно, обозначим: A₁, A₂, ..., A_m – для игрока A; B₁, B₂, ..., B_n – для игрока В. Если игра состоит только из личных ходов, то выбор стратегий A_i и B_j игроками однозначно определяет исход игры – наш выигрыш а_ij. Если известны a_ij для всех сочетаний стратегий, то они образуют платежную матрицу размером m х n, где: m – число строк матрицы, а n – число его столбцов.

Платёжная матрица

Предлагаемые стратегии игрока А	Стратегии игрока В
В₁	В₂	В_j	…	В_n
Стратегия A₁	a₁₁	a₁₂	a₁_j	…	a_1m
Стратегия A₂	a₂₁	a₂₂	a₂_j	…	a_2m
Стратегия A_i	a_i₁	a_i₂	a_ij	…	a_i_m
…	…	…	…	…
Стратегия A_m	a_m₁	a_m₂	a_mj	…	a_m_n

Нижняя и верхняя цена игры. Поставим задачу: определить наилучшую среди наших стратегий A₁, A₂ , ..., A_m. Условимся рассматривать только чистые стратегии. Затем проанализируем последовательно каждую из них от A₁ до A_m. Выбирая A_i, мы должны рассчитывать, что противник ответит на нее той из стратегий B_j, для которой наш выигрыш минимален.

Найдем минимальноеиз чисела_ij в i-той строкеи обозначим егоa_i:

Естественно, что осторожный игрок должен выбрать ту стратегию, для которой число a_i максимально. Обозначим это максимальное значение a:

а принимая во внимание формулу для a_i, можно записать:

Величина a называется нижней ценой игры, максиминным выигрышем или максимином. Соответствующая стратегия называется максиминной стратегией.

Очевидно, что аналогичное рассуждение можно провести и за сторону В. Эта сторона заинтересована в том, чтобы обратить наш выигрыш в минимум, то есть максимизировать свой выигрыш. Поэтому будут выделены максимальные значения выигрыша по столбцам:

Затем ищут минимальное значение b_j:

или .

Величина b называется верхней ценой игры, иначе – минимаксным выигрышем или минимаксом.Соответствующая выигрышу b стратегия называется его минимаксной стратегией.

Принцип осторожности,диктующий игрокам выбор соответствующих стратегий(максиминной и минимаксной),является в теории игр основным принципом иназывается принципом минимакса.

1. Критерий Вальда (наибольшая осторожность) - «рассчитывай на худшее» или критерий крайнего пессимизма - называют критерий, предписывающий обеспечить значение параметра эффекта, равного α.

На основе данных платёжной матрицы определяются максиминные оценки стратегий, показывающие гарантированный максимальный выигрыш в наихудших условиях, т.е.:

Платёжная матрица дополненная столбцом ММ-критерия

Предлагаемые стратегии игрока А	Стратегии игрока В	ММ-критерий
В₁	В₂	В_j	…	В_n
Стратегия A₁	a₁₁	a₁₂	a₁_j	…	a_1m	W₁ = min_j a₁_j
Стратегия A₂	a₂₁	a₂₂	a₂_j	…	a_2m	W₂ = min_j a₂_j
Стратегия A_i	a_i₁	a_i₂	a_ij	…	a_i_m	W_i = min_j a_ij
…	…	…	…	…	…	…
Стратегия A_m	a_m₁	a_m₂	a_mj	…	a_m_n	W_m = min_j a_mj

Этот критерий ориентирует лицо, принимающее решение, на наихудшие условия и рекомендует выбрать ту стратегию, для который выигрыш максимален. В других, более благоприятных условиях использование этого критерия приводит к потере эффективности системы или операции.

Выбранная таким образом стратегия полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать ММ-критерий одним из фундаментальных.

Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:

· о возможности появления состояний окружающей среды ничего не известно;

· решение реализуется только один раз;

· необходимо исключить какой бы то ни было риск.

2. Критерий Сэвиджа (минимизация большого риска) «рассчитывай на лучшее».

5rik.ru

Материалы для учебы и работы

Теория игр и критерии оценки рискованности решения