Смешанные стратегии и их свойства
Если матричная игра не имеет седловой точки, т.е. , то применение минимаксных стратегий приводит к тому, что для любых из игроков выигрыш не меньше , а проигрыш не больше . Решение находят, применяя смешанные стратегии.
Смешанной стратегией игрока А называется вектор , где
и , , (3.9)
- вероятность, с которой игрок А выбирает свою чистую стратегию .
Смешанной стратегией игрока B называется вектор , где
и , , (3.10)
- вероятность, с которой игрок B выбирает свою чистую стратегию .
Чистые стратегии являются частным случаем смешанных. Например, если – чистая стратегия игрока А, то вероятность её выбора равна 1, т.е. . Так как игроки выбирают свои чистые стратегии случайно и независимо друг от друга, то игра принимает случайный характер. Случайной становится и величина выигрыша игрока А (проигрыша игрока В). Поэтому говорить можно лишь о средней величине выигрыша. Эта величина является функцией смешанных стратегий и определяется по формуле математического ожидания:
(3.11)
Функция называется платежной функцией игры с матрицей .
Смешанные стратегии и называют оптимальными, если они образуют седловую точку для платежной функции т.е. удовлетворяют неравенству
(3.12)
Значение платежной функции при оптимальных смешанных стратегиях и , т.е. называют ценой игры. Совокупность оптимальных стратегий и цены игры составляет решение игры.
Стратегия является доминирующей над стратегией , если все элементы l-й строки не меньше соответствующих элементов i-й строки, т.е. , ( стратегия доминируемая).
Стратегия является доминирующей над стратегией , если все элементы k-го столбца меньше или равны соответствующим элементам j-го столбца, т.е. , ( стратегия доминируемая).
Исключение из платежной матрицы доминируемых стратегий (ими игрокам пользоваться заведомо невыгодно) позволяет уменьшить ее размерность, а это упрощает решение игры. Вероятность применения доминируемых стратегий равна нулю.
Теорема 1. Оптимальные смешанные стратегии и соответственно игроков А и В в матричной игре с ценой будут оптимальными и в матричной игре с ценой , где .
Следовательно, платежную матрицу, имеющую отрицательные числа, можно преобразовать в матрицу с положительными числами. В последней матричной игре цена игры будет положительная: .
Теорема 2. Всякая матричная игра с нулевой суммой имеет решение в смешанных стратегиях.
Теорема 3. Для того чтобы смешанные стратегии и были оптимальными для игроков А и В в игре с матрицей и выигрышем , необходимо и достаточно выполнение неравенств
, (3.13)
, (3.14)
Следствия.
1. Если игрок А применяет оптимальную смешанную стратегию , а игрок В любую чистую стратегию , то выигрыш игрока А будет не меньше цены игры .
2. Если игрок В использует оптимальную смешанную стратегию , а игрок А – любую чистую стратегию , то проигрыш игрока В не превысит цену игры .
Пример 11. Упростить платежную матрицу:
Решение: