Значимые выборки
Данный метод чаще всего используется в тех случаях, когда рассчитываемый показатель исследуемой системы может быть представлен как определенный интеграл со сложной подынтегральной функцией и сложной областью интегрирования.
Пусть рассчитывается интеграл следующей структуры:
(19)
где g(x), f(x) – заданные функции;
Gx – область интегрирования.
Не обязательно, чтобы функции g(x), f(x) и область Gx были заданы явно, например, аналитически. Процедуры их определения могут быть очень сложными. Кроме того, в реальной задаче интеграл может быть k-кратным (то есть х – это вектор; dx = dx1…dxk).
В (19) функция f(x) может интерпретироваться как плотность вероятности. При необходимости ее нужно перенормировать:
, (19а)
где ; .
Тогда значение интеграла можно интерпретировать как среднее значение функции g(x) при заданном распределении случайной величины х:
.
В частном случае интеграл I действительно (изначально) может отображать среднее значение заданной функции g(x) наблюдаемой случайной переменной х, имеющей известную плотность распределения f(x).
Метод расчета интеграла с помощью имитационного эксперимента относят к классу методов имитационного моделирования, которые принято называть общим термином "метод Монте-Карло", или иначе – метод статистических испытаний. Можно указать две существенно различные схемы реализации метода.
Для простоты рассмотрим одномерный случай.
В первой схеме разыгрывают последовательность равномерно распределенных в области Gx случайных значений переменной х: х1, х2, …, хп. Несмещенная выборочная оценка интеграл в этом случае будет иметь вид:
, (20)
где DG – объем области интегрирования.
Наиболее "естественно" такая схема выглядит в случае, если просто интегрируется функция g(x) - без весового коэффициента f(x). В этом случае в (20) сомножитель f(xi) исключается (равен 1).
Во второй схеме также разыгрывают последовательность случайных значений переменной х: х1, х2, …, хп, однако розыгрыш реализуют иначе – в предположении что случайная переменная х подчиняется распределению с плотностью распределения f(x) – см. п.1.3.
Несмещенная выборочная оценка интеграл в этом случае будет иметь вид:
(21)
Именно эта вторая схема и является реализацией метода значимых выборок.
Суть понятия "значимая выборка" заключается в том, что при определении последовательности значений х1, х2, …, хп мы выбираем эти значения не "на равных правах" (на основе равномерного распределения). Выбираются, по преимуществу, "более значимые (более вероятные)" значения – в смысле заданного распределения f(x).
Метод значимых выборок можно обобщить следующим образом.
Пусть необходимо рассчитать интеграл
. (22)
Переопределим подынтегральную функцию следующим образом:
, (23)
где f(x) специально подобранная функция, которую можно интерпретировать как плотность распределения, то есть:
;
g*(x) = g(x)/f(x).
Тем самым мы сводим задачу к предыдущей и можем реализовать схему метода значимых выборок, оперируя "искусственной" плотностью распределения f(x).
По определению
I = E[g*(x)].
и, следовательно,
(24)
Если подобрать плотность f(x) соответствующим образом, то можно значительно уменьшить дисперсию выборочного среднего (24). Действительно, учтем, что в имитационном эксперименте (24) наблюдаемой является величина g* = g/f, то есть частное от деления двух других случайных коррелированных величин (так как они зависят от общей случайной переменной x). Следовательно, если обеспечить положительную корреляцию величин g и f, то можно значительно понизить дисперсию величины g*. Не приводя точных расчетных формул, покажем это на грубых оценках.
Предположим, что отношение g/f конечно, то есть g1* £ g/f £ g2*. Тогда
Var[g*] £ (g2* - g1*)2/4.
Следовательно, если функция f будет примерно пропорциональна g, разброс отношения g/f будет небольшим, то есть значения g1* и g2* будут близки. В пределе, если положить f = g/I, где I – истинное значение интеграла, получим g1* = g2* и, следовательно, Var[g*] = 0. Естественно, что такой предел недостижим, поскольку значение интеграла априори неизвестно, но можно констатировать, что в методе значимых выборок существует принципиальная возможность значительного уменьшения погрешности расчета интеграла.
4. Некоторые типы систем массового обслуживания
(для проведения имитационных экспериментов)
В данном разделе мы рассмотрим несколько видов простых систем массового обслуживания, которые полезно использовать для отработки "техники" имитационного моделирования и тестирования имитационных моделей.
Предполагается, что разработанная студентом имитационная модель в рамках самостоятельной работы №1 при некоторых значениях параметров должна содержательно совпадать с какой-то простой моделью массового обслуживания из числа рассмотренных ниже (с какой конкретно – выбирает студент при проектировании имитационной модели). Соответственно, критерием правильности имитационной модели должно быть совпадение расчетных значений некоторых показателей со значениями этих же показателей, точно оцениваемых в рамках модели массового обслуживания.
В основном мы рассмотрим простейшие стационарные пуассоновские модели (п.4.1), дополнительно – одну более сложную модель (п. 4.2)[10].
Классификацию СМО будем проводить, пользуясь расширенными обозначениями Кендалла (a/b/c):(d/e/f) (см. п.1.2). Конкретные значения параметров а и b (типы входного и выходного потоков) будем обозначать так:
М – пуассоновский (марковский) поток. Это значит, что временные интервалы Dtз между входными заявками и время обслуживания заявки Dtо в одном канале обслуживания распределены экспоненциально;
D – интервалы Dtз и Dtо имеют фиксированные значения (детерминированы);
Eз – поток Эрланга k-го порядка. Это значит, что интервалы Dtз и Dtо имеют гамма-распределение;
GI – произвольный тип распределения интервалов Dtз;
G – произвольный тип распределения интервалов Dtо.
Для дисциплины очереди (параметр d) будем использовать следующие обозначения:
FCFS – первым пришел первым обслуживаешься;
LCFS – последним пришел первым обслуживаешься;
SIRO – случайный отбор клиентов;
GD – произвольный тип дисциплины.