Оценка информационного объема и риска модели измерения
Определение количества информационных переменных ММИ. Пропускная способность П статистического эксперимента, полученная в соответствии с его теоретико-информационной моделью [3], позволяет определить количество информационных переменных ММИ, необходимых для получения достаточной входной информации. Для этого определим объём передачи информации модели как разность между энтропией входов (априорной неопределенностью) и средней условной энтропией входов на выходе (апостериорная неопределенность), причем в общем случае каждый из входных параметров характеризуется вероятностью его появления на i-м входе Pi:
П(Pi, f1,..., fn) = H(y) – H(y|x),
где априорная неопределенность H(y) и апостериорная неопределенность H(y|x) определяются следующими выражениями:
H(y)=– P(H1)logP(H1)–....–P(Hn)logP(Hn)= –P1logp1–...–Pnlogpn, (2.16)
H(y|x)=–P(H1|x)logP(H1|x)+P(Hn|x)log(Hn|x))f(x)dl(x), (2.17)
в которых f(x) = P1f1(x) + P2f2(x) +...+ Pnfn(x). Мера связи между входными и выходными переменными, используя последние выражения для (2.16) и (2.17), определяется в виде
П(Pi; fi) = P1f1(x)log
+ ... + Pnfn(x)log
}dl(x) ³ 0,
где P(H, x)dl(x) = P(H|x)f(x)dl(x) – совместная вероятность H и x. Отметим, чтоi(H, x)log
dl(x) может быть определена как средняя информация в X относительно H.
Исследуем выражения для априорной информации в виде пропускной способности модели. Пусть fi(x), i = 1, 2,..., n – плотности распределений, принадлежащих однородному семейству вероятностных мер, а Pi, i = 1, 2,..., n, таковы, что
P1 + P2 +...+ Pn = 1. (2.18)
Теорема 2.5.1. Максимум величины
П(Pi; fi) =Pifi(x)log
]dl(x)
по всевозможным наборам Pi достигается для таких Pi, что
1(x)log
dl(x) =
2(x)log
dl(x)=...=
n(x)log
]dl(x) (2.19)
и П(Pi, fi) = n равен этой общей величине.
Доказательство. Взяв производную от dП(Pi; fi)/dPi (учтя выражение (2.18)) и приравняв ее к нулю получаем, что
j(x)log
dl =
ifi(x)[log
]¢dl. =
=ifi(x)
fi(x)
fj(x)dl. =
j(x)dl = 1.
Из данного выражения и следует условие (2.19). Из данной теоремы вытекает следствие, которое связывает структуру ММИ и пропускную способность эксперимента, соответствующего ММИ.
Следствие 2.5.1. Многопараметрическая модель измерения, включающая n признаков с плотностями распределения f1(x),..., fn(x), i = 1, 2,..., n, характеризуется максимальной пропускной способностью при условии равенства расхождений между моделью и каждым её признаков.
Определение риска синтеза многопараметрической линейной ММИ. Пусть в общем случае fi(xi), i = 1, 2,..., n – плотности распределения признаков xi ММИ, а f(x1, х2,..., хn) – плотность распределения, порожденная линейной ММИ
y = a1 x1 + a2х2 +...+ anхn + a0,
причем p(x1, х2,..., хn) есть плотность распределения, порожденная истинной ММИ, принадлежащая к тому же семейству вероятностных мер [84]. При этом ММИ определяет теорема эмерджентности, доказательство которой приведено в [3].
Теорема (эмерджентности) 2.5.2. Для различения истинной модели измерения, заданной посредством плотности распределения p(x1, х2,..., хn), линейная модель, которая состоит из n признаков с плотностями распределения f1(x1),..., fn(xn), данная посредством плотности распределения f(x1, х2,..., хn), содержит информацию меньшую или равную сумме информации, доставляемой признаками модели, т.е.
fi(xi)logfi(xi)/p(x1, х2,..., хn)]dl(xi) ³
³ f(x1, х2,..., хn)logf(x1, х2,..., хn)/p(x1, х2,..., хn)]dl(x1, х2,..., хn)
с равенством при условии .
Поскольку многопараметрическая ММИ, удовлетворяющая данной теореме, обладает максимальной пропускной способностью, то она характеризуется минимальным риском для линейной модели. В связи с этим, воспользовавшись введенным в разд. 2.1 понятием риска ММИ параметра и используя свойство аддитивности функционала риска, можно сформулировать следствие.
Следствие 2.5.2. Минимальный риск RЛМ многопараметрической линейной ММИ для признаков с интенсивностью риска каждой компоненты модели mi характеризуется интенсивностью риска:
.
Риск многопараметрической линейной модели измерения задается предельным значением риска выбора модели измерения параметра, которое получено в разд. 1.5 и определяется интегральными вероятностными параметрами.