Лекция 28 Статистическая проверка непараметрических гипотез.

Нулевой непараметрической гипотезой называется гипотеза относительно общего вида функции распределения СВ .

Проверка гипотезы о предполагаемом распределении производится с помощью непараметрических критериев значимости. Принципы построения таких критериев и методика проверки остаются практически теми же, что и при параметрических гипотезах, т.е. проверка непараметрических гипотез производится на основании вычисления некоторой выборочной статистики (критерия), распределение которой получено в предположении истинности нулевой гипотезы и сравнения наблюдаемого значения этой выборочной статистики с критическим значением.

Непараметрические критерии значимости условно можно подразделить на две группы. К первой группе относятся критерии согласия, с помощью которых проверяются нулевые гипотезы относительно общего вида функции распределения. К другой группе непараметрических критериев относятся критерии, с помощью которых проверяется нулевая гипотеза о принадлежности двух выборок одной и той же генеральной совокупности (две генеральные совокупности имеют одну и ту же функцию распределения).

П.1 Критерий согласия Пирсона.

Критерий Пирсона позволяет производить проверку согласия эмпирической функции распределения с гипотетической функцией , принадлежащей к некоторому множеству функций определенного вида (нормальных, показательных, биномиальных и т.д.).

Пусть СВ имеет функцию распределения , принадлежащую некоторому классу функций . Из генеральной совокупности извлечена выборка объема .

Разобьем весь диапазон полученных результатов на частичных интервалов равной длины, и пусть в каждом частичном интервале оказалось измерений, причем . Составим сгруппированный статистический ряд распределения частот:

Интервалы наблюдаемых значений СВ       …     …  
Частоты

Требуется на основе имеющейся информации проверить нулевую гипотезу о том, что гипотетическая функция распределения значимо представляет данную выборку, т.е. .

При проверке нулевой гипотезы с помощью критерия согласия придерживаются следующей последовательности действий:

1) на основании гипотетической функции вычисляют вероятности попадания СВ в частичные интервалы :

;

2) умножая полученные вероятности на объем выборки , получают теоретические частоты частичных интервалов , т.е. частоты, которые следует ожидать, если нулевая гипотеза справедлива;

3) вычисляют выборочную статистику (критерий) :

. (28.1)

Замечание 1.При проверке гипотезы о нормальном распределении СВ вероятности попадания СВ в частичные интервалы находят по формуле: Ф– Ф, где Ф– функция Лапласа (приложение 2).

Если нулевая гипотеза верна, то при распределение выборочной статистики (28.1) независимо от вида функции стремится к распределению с степенями свободы (– число частичных интервалов; – число параметров гипотетической функции , оцениваемых по данным выборки).

Критерий сконструирован таким образом, что чем ближе к нулю наблюдаемое значение критерия , тем вероятнее, что нулевая гипотеза справедлива. Поэтому для проверки нулевой гипотезы применяется критерий с правосторонней критической областью. Следовательно, для того, чтобы проверить нулевую гипотезу, необходимо найти по таблицам квантилей -распределения по заданному уровню значимости и числу степеней свободы критическое значение , удовлетворяющее условию . Сравнивая наблюдаемое значение выборочной статистики , вычисленное по формуле (28.1), с критическим значением , принимаем одно из двух решений:

1) если набл , то нулевая гипотеза отвергается в пользу альтернативной , т.е. считается, что гипотетическая функция не согласуется с результатами эксперимента;

2) если набл <, то считается, что нет оснований для отклонения нулевой гипотезы, т.е. гипотетическая функция согласуется с результатами эксперимента.

Замечание 2. При применении критерия необходимо, чтобы в каждом частичном интервале было не менее 5 элементов. Если число элементов (частота) меньше 5, то рекомендуется объединять такие частичные интервалы с соседними.