Правило последовательных выборок

Правил

Определения последовательных байесовских

Использование апостериорной вероятности для

Будем рассматривать только такие игры, в которых результаты отдельных испытаний являются независимыми случайными величинами.

Обозначим — вероятности исходов j-ого эксперимента при состоянии природы z.

Стоимость отдельного испытания будем считать за 1.

В качестве основы для описания плана последовательных выборок примем распределение вероятности q(z), . Причем — априорное распределение вероятности до начала испытания, — апостериорное распределение вероятности после первого испытания, - апостериорное распределение вероятности после j испытания.

Очевидно, что содержит в себе всю информацию о состоянии природы, которая была определена до начала эксперимента и накопилась в результате последовательности проведения из j испытаний.

можно рассматривать как априорное распределение вероятности перед (j+1) испытанием или апостериорное распределение вероятности после j испытания. Формально преобразование в можно описывать в виде действия некоторого оператора Т:

Развернуто это соотношение можно записать в следующем виде (по формуле Байеса):

.

Принцип получения плана последовательной выборки становится удобным, если его рассматривать на следующей выборке: , .

Обозначим: и .

Пространство Z смешанных стратегий природы будет определяться областью значений . Ясно, что при .

 

Если q=0,5 , то отдать предпочтение какому-либо решению нельзя, следовательно они равновесные. В этом случае необходимо провести опыт с тем, чтобы уточнить вероятность состояния природы. Предположим, что имеются: и , .

Если ;

Если .

Если , то надо продолжить эксперимент.

Подобные области значений можно сделать и для 3 состояний природы .

Для всех точек, не входящих в , принимают решение продолжить эксперимент. Ясно, что когда q — апостериорная вероятность, попадает в какой-либо из треугольников, то эксперимент прекращается, поскольку каждое испытание мы оценили в стоимость 1, то небезразлично, на какой стадии прекратить эксперимент.

При анализе ситуации интерес вызывают только будущие испытания Можно минимизировать затраты лишь на предстоящих испытаниях. При каждом испытании определяются апостериорные вероятности состояний природы и — области останова . Если проведены j испытаний, то удобно рассматривать:

, где N — число испытаний, входящих в полный единичный эксперимент. При каждом испытании для всех решений следует определять области останова. В литературе утверждается, что эти области должны быть выпуклыми и непересекающимися для каждого решения.

 

Выборка — результаты испытаний.

Пусть выделены каким-либо образом области останова: .

Правило последовательных выборок состоит в следующем:

Первоначально известно априорное состояние природы , . В запасе все N экспериментов. Если , то принимаем решение . Если , то принимается решение провести первый эксперимент. Проведя первое испытание, рассчитывается ,

а) если то принимают решение ;

б) еслито принимают решение продолжить эксперимент, j=2 и т.д., до тех пор пока j=N.

Если для всех N-1 наблюдений выполняется условие типа «б», то проводят последнее испытание, после которого выбор решения уже обязателен.

Очевидно,, где Q — множество смешанных стратегий природы. Отсюда видно, что задача определяется последовательностью для всех j=1,2,...,N.