Игры с природой с экспериментами.
Отчет о работе
Подготовьте отчет о выполненной лабораторной работе. Он должен содержать титульный лист, формулировку задания, исходные данные, описание проблемы, которая была разрешена. Укажите случайный параметр, взятый в рассмотрение, и обоснуйте его выбор. Приведите обоснование выбора его значений. Представьте платежную матрицу и результаты ее обработки. Укажите решение, полученное при использовании критерия Вальда. Представьте матрицу риска и укажите решение, полученное при использовании критерия Сэвиджа. Приведите результаты решения задачи с использованием критерия Гурвица. Покажите зависимость принятого решения от значения параметра критерия Гурвица. Сформулируйте выводы, которые можно сделать по результатам выполненной работы.
Пример содержания отчета о выполнении лабораторной работы приведен в приложении Б.
Рассмотренные выше игры с природой предусматривали необходимость принятия нами решения в условиях неопределенности на основе имеющихся у нас данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов. Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами.
Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а мы можем только делать вывод о целесообразности его проведения на основании имеющейся априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки конечен и известен заранее.
Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания мы можем принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте), или быть неограниченным (неограниченный последовательный эксперимент).
Будем считать, что в нашем распоряжении имеется набор стратегий
, которые он может использовать в ответ на одну из
возможных стратегий природы
, появляющуюся с вероятностью
при условии
.
Известна также платежная матрица . Для снижения неопределенности относительно действительного состояния природы мы можем провести эксперимент, стоимость которого известна и равна
. Пусть в результате проведения эксперимента состояние природы станет известно точно. Необходимо сделать вывод о целесообразности проведения эксперимента.
Наш средний выигрыш при использовании стратегии
может быть определен как
. (9)
В качестве оптимальной стратегии может быть выбрана стратегия , максимизирующая наш средний выигрыш
.
Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы . Очевидно, что в этом случае мы должны выбирать стратегию, обеспечивающую наш максимальный выигрыш
. (10)
Оценим теперь средний возможный выигрыш после проведения эксперимента
где ‑ стоимость проведения эксперимента. Отсюда появляется условие целесообразности проведения эксперимента
или
.
Преобразовывая неравенство, имеем
. (11)
Выражение в круглых скобках есть ничто иное как риск
.
Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной следует выбрать стратегию максимизирующую средний выигрыш или минимизирующую средний риск.
Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из несовместимых событий
, связанных определенными вероятностями с состояниями (стратегиями) природы. Обозначим условную вероятность появления исхода
эксперимента при условии стратегии природы
символом
. Поскольку
образуют полную систему событий, справедливо
.
Будем считать, что все значения известны, а также известна стоимость проведения эксперимента
. Нас по прежнему будет интересовать вопрос: целесообразно ли проведение эксперимента и если да, то какую стратегию необходимо выбрать при том или ином исходе эксперимента. Предположим, что в результате эксперимента был получен результат
. Определим апостериорные вероятности стратегий природы по теореме Байеса [6]
.
Далее для каждой стратегии рассчитаем величину условного среднего выигрыша при условии результата эксперимента
.
Очевидно, что оптимальной будет стратегия , обеспечивающая максимум условного среднего выигрыша при конкретном исходе эксперимента
.
Вероятность появления условного выигрыша совпадает с вероятностью появления события
. Обозначим ее символом
. Тогда
.
Величина выигрыша с использованием эксперимента
.
С другой стороны наш выигрыш без проведения эксперимента определяется выражением
.
Отсюда вытекает условие целесообразности проведения эксперимента
Если проведение эксперимента признано целесообразным, то необходимо разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию необходимо выбрать, если эксперимент дал результат
?