Описание рабочей нагрузки


Цели и основные этапы анализа производительности

Методология оценки производительности состоит из последовательности этапов. Сначала производиться выбор меры производительности, то есть тех параметров, по которым будет вычисляться оценка.

• CRT - уровень схем и регистровых передач;

• PMS - уровень взаимодействия процессор - память;

• ISP - уровень системы команд (здесь уже начинается программный уровень);

• SVC - уровень системных вызовов и прерываний;

• PS - уровень программных процессов;

• JOB - уровень работ (программ);

• TASK- уровень задач (комплексы работ).

После этого определяется зависимость производительности от структуры анализируемой системы и ее рабочей нагрузки. Для этого строят модель рабоче нагрузки (модель потребления прикладно программо ресурсов системы) и модель


вычислительной системы. С помощью моделе рабоче нагрузки и вычислительной системы строится модель производительности с выбранными параметрами рабоче нагрузки и вычислительной системы. Задавая конкретные значения этим параметрам, вычисляются конкретные значения системно производительности.

Основные задачи оценки производительности:

сравнительная оценка существующих систем (обычно проводится с целью классификации или выбора вычислительно системы из числа имеющихся);

оптимизация, то есть настройка и контроль производительности: в данном случае производительность оценивается по отношению к различным параметрам системы и ее рабочей нагрузки (это делается с целью настройки операционно системы на заданную конфигурацию системы, либо с целью оценки различных направлений развития системы);

прогнозирование производительности: оценка производительности проектируемо вычислительно системы, то есть анализируемая система отсутствует, что создает серьезные трудности при построении модели рабочей нагрузки и проверке модели системы.

Производительность, как правило, отражает реакцию вычислительно системы на конкретную рабочую нагрузку. Корректность оценок производительности зависит от адекватности отражения характеристик конкретного прикладного процесса, т.е. от используемо модели рабочей нагрузки. Без хорошего знания рабочей нагрузки, анализ и прогноз производительности в лучшем случае будут неточны.

Модель рабочей нагрузки используется либо для загрузки исследуемой вычислительной установки, то есть когда экспериментально замеряются ее параметры, либо как исходные данные для модели анализируемо системы. Основные функции модели рабочей нагрузки формулируются следующим образом:

предоставить корректную, адекватную и представительную характеристику прикладного процесса для прогнозирования его поведения на классе систем настолько широком, насколько это возможно;

обеспечить управляемые и воспроизводимые эксперименты при оценке производительности;

сократить настолько, насколько это возможно количество анализируемых данных без ущерба точности анализа;

предоставить данные в форме, пригодной для их использования моделью системы.

Основными видами моделе рабоче нагрузки на сегодняшний день являются:

смеси команд;

эталоны;

стохастические модели;

трассы.

Смеси команд

Заключается в выборе последовательности команд машины, "типичной" с точки зрения некоторого приложения. "Типичность" определяется через функцию распределения встречаемости команд в программе для определенного приложения. Эту

 


функцию строят методами математической статистики, например, с помощью кластерного или регрессионного анализов.

Данный подход к моделированию рабоче нагрузки не охватывает внутренние взаимозависимости по управлению в программе, возникающие из-за информационных связе между переменными программы. Данный метод является малонадежным и трудноприменимым из-за наличия в современных вычислительных системах широкого спектра форматов команд, применяемых способов адресации, а также влияния трансляторов и логической среды.

Эталоны

Эталоны - это образцы использования ресурсов системы прикладным процессом, т.е. эталоны рабоче нагрузки для определенно вычислительной системы или ее прототипа. В качестве эталонов обычно выступают отдельные программы или наборы программ. Эталоны могут быть построены из уже существующих программ. Способы построения эталонов могут быть самыми разными: от случайного выбора программ на входе системы до тщательного подбора каждого оператора в эталоне.

Данный подход применяется в основном для сравнения существующих систем. При его использовании на эмуляторах(на уровне системы команд) имеет значительные недостатки: характеризуется низкой эффективностью и большими накладными расходами, а также опасностью искажения собираемых данных о работе системы, так как в процессе эмуляции используются компоненты другой вычислительной системы.

Стохастические модели рабочей нагрузки

Рабочую нагрузку описывают с помощью случайных величин, которые представляют запросы на ресурсы. Распределения этих случайных величин подбираются на основе статистического анализа результатов измерени потока запросов на соответствующие ресурсы реально действующей вычислительной установки. Как правило, полученны результат аппроксимируют экспоненциальным распределением, математические свойства которого хорошо известны. Такая модель рабоче нагрузки не точна и точность оценок производительности, получаемых с ее помощью не более 40-30%.

Недостатки:

данные, собираемые на действующе установке, могут нести на себе отпечаток то системы, на которой они собирались (системная зависимость);

измерительная система, используемая для сбора данных, может искажать собираемые данные настолько, насколько она сама использует ресурсы системы (оценить это влияние практически не возможно);

трудно охватить взаимосвязи между разными характеристиками потока запросов, представленных разными случайными величинами (используется гипотеза о статистической независимости случайных величин, что является не корректным).

Использование данного подхода при проектировании вычислительных систем очень ограничено, так как для оценки различных вариантов системы может потребоваться более детальная, по сравнению с уже собранной, информация.

Трассы

Рабочую нагрузку представляют в виде множества упорядоченных записе, содержащих данные о работе программ. Эти данные собирают с помощью специальных измерительных средств, а затем, после специальной обработки, используют как модель


|абоче нагрузки. Главным достоинством этого подхода является то, что он сохраняет все

взаимозависимости между действиями, как отдельно программы, так и комплекса программ.

Недостатки:

при измерениях всегда существует вероятность искажения измеряемых данных;

измерения носят системно-зависимы характер как в части уровня, на котором проводились измерения, так и в части результатов измерения, алгоритмов, используемых в системе;

создание программ предварительно обработки трассы и подготовки ее к использованию моделью системы очень трудоемко.

Данный подход к построению модели рабоче нагрузки применялся только к программам в нераспределенной вычислительной среде (однопроцессорная ЭВМ), так как при наличии распределенной среды (многомашинные или многопроцессорные системы) при одних и тех же исходных данных история выполнения программы будет меняться при каждом ее исполнении;