Обработка и анализ результатов моделирования систем

Федоров Евграф Степанович (1853 – 1919) минералог и кристаллограф. Современные структуры кристаллографии и минералогии.

Бутлеров Александр Михайлович – структурная теория.
Белов Николай Васильевич (1891 – 1982) – кристаллограф, геохимик, профессор МГУ,– методы расшифровки структур минералов.

В методике системного анализа главное - процесс постановки задачи.

В экономике нужна методика, содержащая средства, позволяющие постепенно формировать модель, обосновывая ее адекватность на каждом шаге формирования с участием ЛПР. Задачи, решение которых ранее было основано на интуиции (проблема управления разработками организационных структур), теперь не решаема без системного анализа.
Необходимо в экономике использовать системный подход при изучении проблемной ситуации и привлекать средства системного анализа для решения этой проблемы. Особенно полезно использовать методологию системного подхода и системного анализа при решении сложных проблем - выдвижении и выборе концепции (гипотезы, идеи) стратегии развития фирмы, разработке качественно новых рынков сбыта продукции, совершенствование и приведение в соответствие с новыми условиями рынка внутренней среды фирмы и т.д.
Прежде всего, основным и наиболее ценным результатом системного анализа признается не количественно определенное решение проблемы, а увеличение степени ее понимания и сущности различных путей решения.

Это понимание и различные альтернативы решения проблемы вырабатыва-ются специалистами и экспертами и представляются ответственным лицам для ее конструктивного обсуждения.

Системный анализ включает:

методологию проведения исследования,

выделение этапов исследования и обоснованный выбор методики выполнения каждого из этапов в конкретных условиях.

Особенное внимание в этих работах уделяется определению целей и модели системы и их формализованному представлению.
Задачи исследования систем можно разделить на задачи анализа и задачи синтеза.
Задачи анализа
заключаются в исследовании свойств и поведения систем в зависимости от их структур, значений параметров и характеристик внешней среды.

Задачи синтеза заключаются в выборе структуры и таких значений внутренних параметров систем, чтобы при заданных характеристиках внешней среды и других ограничениях получить заданные свойства систем.
Основными этапами системного анализа являются:

- формулировка проблемы,

- формирование проблематики,

- определение целей,

- постановка задачи,

- генерирование альтернатив,

- моделирование.

 

 

После того как машинный эксперимент спланирован, необходимо предусмотреть меры по организации эффективной обработки и представления его результатов. Вообще, проблема статистической обработки результатов эксперимента с моделью выделяется в самостоятельную проблему. При этом надо иметь в виду, что применяемые на практике методы обработки результатов моделирования составляют только небольшую часть арсенала математической статистики [2-5]

При выборе методов обработки существенную роль играют три особенности машинного эксперимента с моделью системы .

1. Возможность получать при моделировании системы на компьютере большие выборки позволяет количественно оценить характеристики процесса функционирования системы, но превращает в серьезную проблему хранение промежуточных результатов моделирования. Эту проблему можно решить, используя рекуррентные алгоритмы обработки, когда оценки вычисляют по ходу моделирования, причем большой объем выборки дает возможность пользоваться при этом достаточно простыми для расчетов на компьютере асимптотическими формулами.

2. Сложность исследуемой системы при ее моделировании на компьютере часто приводит к тому, что априорное суждение о характеристиках процесса функционирования системы, например о типе ожидаемого распределения выходных переменных, является невозможным. Поэтому при моделировании систем широко используются непараметрические оценки и оценки моментов распределения.

3. Блочность конструкции машинной модели и раздельное исследование блоков связаны с программной имитацией входных переменных для одной частичной модели по оценкам выходных переменных, полученных на другой частичной модели. Если компьютер, используемый для моделирования, не позволяет воспользоваться переменными, записанными на внешние носители, то следует представить эти переменные в форме, удобной для построения алгоритма их имитации.

 

4.1. Методы обработки результатов измерений

 

Рассмотрим наиболее удобные для программной реализации методы оценки распределений и некоторых их моментов при достаточно большом объеме выборки (числе реализаций ). Математическое ожидание и дисперсия случайной величины , соответственно имеют вид:

 

где - плотность распределения случайной величины , принимающей значения .

При проведении имитационного эксперимента со стохастической моделью системы определить эти моменты нельзя, так как плотность распределения, как правило, априори неизвестна. Поэтому при обработке результатов моделирования приходится довольствоваться лишь некоторыми оценками моментов, полученными на конечном числе реализаций . При независимых наблюдениях значений случайной величины в качестве таких оценок используются:

 

 

где и - выборочное среднее и выборочная дисперсия соответственно. Знак ~ над и означает, что эти выборочные моменты используются в качестве оценок математического ожидания и дисперсии .

К качеству оценок, полученных в результате статистической обработки результатов моделирования, предъявляются следующие требования [2-4]:

1) несмещенность оценки, т е равенство математического ожидания оценки определяемому параметру:

,

где — оценка переменной (параметра) ;

2) эффективность оценки, т е. минимальность среднего квадрата ошибки данной оценки:

,

где - рассматриваемая оценка; - любая другая оценка;

3) состоятельность оценки, т. е. сходимость по вероятности при к оцениваемому параметру:

, .

Рассмотрим оценку выборочного среднего значения . Математическое ожидание выборочного среднего значения составит:

,

т. е. оценка является несмещенной.

С учетом независимости значений средний квадрат ошибки:

,

т. е. оценка состоятельна.

В [3] показано, что эта оценка также и эффективна.

При моделировании сложных систем, к которым относятся сети и системы телекоммуникаций, при большом числе реализаций в результате моделирования получается значительный объем информации о состояниях процесса функционирования системы. Поэтому необходимо так организовать в процессе вычислений фиксацию и обработку результатов моделирования, чтобы оценки для искомых характеристик формировались постепенно по ходу моделирования, т. е. без специального запоминания всей информации о состояниях процесса функционирования системы .

Если при моделировании процесса функционирования конкретной системы учитываются случайные факторы, то и среди результатов моделирования присутствуют случайные величины. В качестве оценок для искомых характеристик рассчитывают средние значения, дисперсии, корреляционные моменты и т. д.

Пусть в качестве искомой величины фигурирует вероятность некоторого события . В качестве оценки для искомой вероятности используется частость наступления события , где - число случаев наступления события ; - число реализаций. Такая оценка вероятности появления события является состоятельной, несмещенной и эффективной. В случае необходимости получения оценки вероятности в памяти компьютера при обработке результатов моделирования достаточно накапливать лишь число (при условии, что задано заранее).

Аналогично при обработке результатов моделирования можно подойти к оценке вероятностей возможных значений случайной величины, т. е. закона распределения. Область возможных значений случайной величины разбивается на интервалов. Затем накапливается количество попаданий случайной величины в эти интервалы , . Оценкой для вероятности попадания случайной величины в интервал с номером к служит величина . Таким образом, при этом достаточно фиксировать значений при обработке результатов моделирования на компьютере.

Для оценки среднего значения случайной величины накапливается сумма возможных значений случайной величины , , которые она принимает при различных реализациях. Тогда среднее значение:

. (4.1)

При этом ввиду несмещенности и состоятельности оценки:

, .

В качестве оценки дисперсии случайной величины при обработке результатов моделирования можно использовать:

. (4.2)

Непосредственное вычисление дисперсии по этой формуле нерационально, так как среднее значение изменяется в процессе накопления значений . Это приводит к необходимости запоминания всех значений . Поэтому более рационально организовать фиксацию результатов моделирования для оценки дисперсии с использованием следующей формулы:

. (4.3)

Тогда для вычисления дисперсия достаточно накапливать две суммы: значений и их квадратов .Для случайных величин и с возможными значениями и корреляционный момент:

, или

.

Последнее выражение вычисляется при запоминании в процессе моделирования небольшого числа значений.

Если при моделировании системы искомыми характеристиками являются математическое ожидание и корреляционная функция случайного процесса , то для нахождения оценок этих величин указанный интервал разбивают на отрезки с постоянным шагом и накапливают значения процесса для фиксированных моментов времени .

При обработке результатов моделирования математическое ожидание и корреляционную функцию запишем так:

(4.4)

где и пробегают все значения .

Для уменьшения затрат машинных ресурсов на хранение промежуточных результатов последнее выражение также целесообразно привести к следующему виду:

. (4.5)

Отметим особенности фиксации и обработки результатов моделирования, связанные с оценкой характеристик стационарных случайных процессов, обладающих эргодическим свойством.

Пусть рассматривается процесс . Тогда с учетом этих предположений поступают в соответствии с правилом: среднее по времени равно среднему по множеству. Это означает, что для оценки искомых характеристик выбирается одна достаточно продолжительная реализация процесса , для которой целесообразно фиксировать результаты моделирования. Для рассматриваемого случая запишем математическое ожидание и корреляционную функцию процесса:

.

На практике при моделировании системы интервал оказывается ограниченным и, кроме того, значения удается определить только для конечного набора моментов времени . При обработке результатов моделирования для получения оценок и используем приближенные формулы:

. (4.6)

которые целесообразно преобразовать к виду, позволяющему эффективно организовать порядок фиксации и обработки результатов моделирования [3].

При обработке результатов машинного эксперимента с моделью наиболее часто возникают следующие задачи:

- определение эмпирического закона распределения случайной величины;

- проверка однородности распределений;

сравнение средних значений и дисперсий переменных, полученных в результате моделирования , и т. д.

Эти задачи с точки зрения математической статистики являются типовыми задачами по проверке статистических гипотез.

Задача определения эмпирического закона распределения случайной величины наиболее общая из перечисленных, но для правильного решения требует большого числа реализаций . В этом случае по результатам машинного эксперимента находят значения выборочного закона распределения (или функции плотности ) и выдвигают нулевую гипотезу , что полученное эмпирическое распределение согласуется с каким-либо теоретическим распределением. Проверяют эту гипотезу с помощью статистических критериев согласия Колмогорова, Пирсона, Смирнова и т. д., причем необходимую в этом случае статистическую обработку результатов ведут по возможности в процессе моделирования системы .

Для принятия или опровержения гипотезы выбирают некоторую случайную величину , характеризующую степень расхождения теоретического и эмпирического распределения, связанную с недостаточностью статистического материала и другими случайными причинами. Закон распределения этой случайной величины зависит от закона распределения случайной величины и числа реализаций при статистическом моделировании системы . Если вероятность расхождения теоретического и эмпирического распределений велика в понятиях применяемого критерия согласия, то проверяемая гипотеза о виде распределения не опровергается. Выбор вида теоретического распределения (или ) проводится по полученным графикам (гистограммам) (или ).