Информационная мера степени изоморфности модели

 

 

Полученный общий показатель качества ММИ может быть использован для целенаправленного ее поиска в соответствии с работами [76, 84]. В качестве характеристики состоятельности выбора элемента модели заданного ПП по экспериментальным данным в выражении (2.1) используется понятие надежности как вероятности ошибочно отвергнуть модель на основании экспериментальных данных y. При этом модель М рассматривается как параметр распределения y и решается задача проверки гипотезы М = М0 против любой из альтернатив М Î М, где М0 – модель, используемая для интерпретации результатов измерения y, М – класс альтернативных моделей. Качество АОЭИ определяется надежностью выбора ММИ, то есть изоморфностью модели результатам эксперимента, и надежностью самой операции редукции измерения, которые определяются соответствующими рисками.

Для введения меры, характеризующей степень изоморфности выбранной ММИ, воспользуемся основными положениями теории информации [66]. Риск, характеризующий принятую модель М0 Î М, определяется, в том числе, уровнем неопределенности в предсказании результата, к которому может привести выбранная модель М0 при оценке состояния объекта. Задача выбора элемента модели ПП относится к классу задач по распознаванию образов, т.е. концептуально выбор элемента ММИ сводится к распознаванию состояния Xi объекта (образа) и выбор конкретного решения на основании распознанного состояния Xi по заданной классификации стандартных моделей М. Таким образом, рассматриваемая задача принятия решения относится к классу задач обучения распознаванию образов.

В задаче выбора элемента модели функция потерь равна нулю (принята правильная модель) либо величине ошибочно принятой оценки модели (принята неправильная модель). Эта особенность задачи минимизации риска выбора элемента модели и определяет специфику данного класса задач. Определённый таким образом риск для задачи классификации позволяет, исходя из общего определения риска, приведенного в разд. 1.2, представить риск выбора элемента модели в следующем виде [80]:

RМ(a) = R0= R0 R1,

где R0 – квадрат принятой оценки модели; R1 – приведенный риск.

Для конкретизации введенного в соответствии с данным выражением понятия приведенного риска выбора элемента модели, рассмотрим функцию S(x0) = P(х>х0), определяющую вероятность преодоления уровня х0 [87]. Если F(х) функция распределения случайной величины Х, то

S(х0) = 1 – F(х0). (2.8)

Если функция распределения F(х) абсолютно непрерывна, то обозначим через f(х) соответствующую плотность распределения случайной величины. Интенсивностью риска по элементам с распределением F(x) назовем функцию (х, x0), характеризующую совместную плотность вероятности параметра x при условии его выхода за заданный предел x0, которая определяется выражением (в соответствии с теоремой Байеса):

(х, x0) = [f(xf2|1(x > x0|x)]/[(xf2|1(x > x0|x)dx],

где f2|1(x > x0|x) – представляет собой функцию-индикатор множества x>x0. В связи с чем

(xf2|1(x > x0|x)dx = f2|1(x>x0|x)(x)dx

и, следовательно,

(х, x0) == . (2.9)

При этом для функции S(x0) из уравнения (2.9), с учетом выражения (2.8), следует

S(х0) = exp[–(х, x0)dx]. (2.10)

Интенсивность риска характеризует вероятность выхода переменной за предел х0 на малом интервале [x0, x0 + x), при условии его достижения значения х0 P(x0 x < x0 + x|x > x0) = =(x0x + o(x).

Определение. Под интегральной интенсивностью риска при выборе по экспериментальным данным элемента ММИ М0ÎМ, с заданной областью ее значений D0, понимается условная вероятность P(xÎD1|D0) попадания выходных параметров выбранной модели М0 в диапазон D1¹D0.

Таким образом, интегральная интенсивность риска выбора элемента модели характеризуется, при выбранной оценке модели, вероятностью P(x Î D1|D0) при условии, что объект находится в заданном исходном диапазоне D0 (условная вероятность), и диапазоном D1, в который может попасть выходной параметр модели. Интегральная интенсивность риска определяет вероятность неправильной идентификации параметра x по экспериментальным данным и равна вероятности ошибки первого рода [114].

Продифференцировав равенство (2.10) по x0, получаем

dS(x0)/dx0=–(x0)×exp[–(х,x0)dx].

После несложных преобразований имеем [ln f(x0) – ln(x0)] = (x, x0).

Усреднив интегральную интенсивность риска на интервале [0, х0) по распределению f(х), получаем выражение для приведенного риска:

R1*(x0) =(х0)(x,x0)dхdх0 = (х0)×ln 0. (2.11)

Таким образом, усредненный приведенный риск на заданном интервале усреднения [0, х) совпадает с выражением для энтропии Кульбака–Лейблера [66], то есть равен “функции различения” между статическим распределением f(x) и интегральной интенсивностью риска (x), которая равна плотности вероятности выхода переменной x за заданный предел x0, что совпадает и с интуитивным пониманием риска. Подобно можно определить риск каждого элемента модели и ее отношений, что в итоге позволяет определить риск общей модели по выражению (2.1). Полученная информационная мера изоморфности (2.11) может быть обобщена для статических многомерных и динамических моделей. При этом входными переменными модели является векторная случайная величина X (Х1,..., Хi,..., Хn), а выходными – векторная случайная величина Y (Y1,..., Yj,..., Ym). Тогда риск j-й выходной переменной будет равен

RM{Х1,..., Хn; Y}= R0(х1,..., хn; уj)log dхdу.

Согласно определению, величина RM(Х1,..., Хn, Yj} характеризует неопределенность выходной величине АОЭИ, которая определяется по вектору входных величин при рассмотрении их совместного влияния на параметр Yj. Данное выражение согласуется с выражением (2.7), которое определяет надежность композиционной модели.