Критерии согласия эмпирического ряда распределения с теоретическим

Эмпирические частоты распределения признака отличаются от теоретических частот. При изучении социально-экономических явлений совпадение эмпирического и теоретического рядов распределения крайне редки.

Важно установить, являются ли разности между эмпирическим и теоретическими частотами результатом действия случайных причин или эта разница существенна и обусловлена неправильно подобранной функцией теоретического распределения (т.е. предположение о распределении признака по данному закону необходимо признать ошибочным).

Для оценки близости эмпирического распределения к теоретическому (нормальному) используются специальные показатели, которые называются критериями согласия. Критерии согласия позволяют установить вероятность того, что расхождение между рядами распределения случайно, т.е. обусловлено случайными факторами.

Принимается нулевая гипотеза (т.е. предположение о чем-либо) о том, что расхождение случайно. Вероятность нулевой гипотезы обозначается Р0:

если Р0>0,05 – то различия между рядами случайны;

если Р0<0,05 – нулевая гипотеза отвергается и доказывается то, что расхождение между рядами вызвано неправильно подобранным законом распределения.

Для оценки близости распределения к нормальному используются следующие критерии:

1. Критерий Хи-квадрат Пирсона ();

2. Критерий Романовского на базе ;

3. Критерий Колмогорова и Смирнова – критерий.

Критерий Пирсона рассчитывается по формуле:

=∑,

где – частоты эмпирического ряда распределения;

– частоты теоретического ряда распределения.

При этом действуют следующие ограничения:

1. должна быть больше 100

2. количество частот в интервале должно быть не менее 5.

При исчислении используется понятие: число степеней свободы, под которым понимают количество независимых переменных, которые могут принимать произвольные значения, не изменяя заданной характеристики (средней величины).

Число степеней свободы рассчитывается:

где m – число групп;

r – число параметров (характеристик теоретического закона распределения); обычно используют 2 параметра: и .

По таблице «Критические значение критерия Пирсона при разном уровне вероятности P и различном числе степеней свободы» на основе заданной вероятности p=0,95 и k=4 определяем табличное значениеПирсона:

Возникает 2 ситуации:

1. если , то отклонение между частотами является случайным и несущественным, а теоретическое распределение хорошо воспроизводит эмпирическое, т.е. нулевая гипотеза подтверждается;

2. если , то отклонение фактических частот от теоретических является существенным и эмпирический ряд распределения не подчиняется закону нормального распределения; нулевая гипотеза отвергается.

С вероятностью 0,95 можно утверждать, что распределение предприятий по урожайности картофеля подчиняется закону нормального распределения, различие между частотами случайно.

2 вариант оценки Пирсона: используется таблица « Таблица вероятностей Пирсона».

Критерий Романовского (на основе) рассчитывается по формуле:

Если p <3, расхождение между частотами случайно, эмпирическое распределение подчиняется нормальному закону распределения;

если p >3, расхождение рядов существенно, эмпирическое распределение не подчиняется нормальному закону распределения.

Критерий Колмогорова – Смирнова (критерий):

,

где D – наибольшая разность между накопленными частотами теоретического и эмпирического рядов;

– сумма накопленных частот.

Для величины математиком Н.В. Смирновым были вычислены вероятности Р0 того, что расхождения несущественно.

По специальным таблицам вероятностей определяют близость к 1, с которой можно утверждать, что отклонения фактических частот от теоретических являются случайными, а данное распределение является нормальным. Если Р0>0,05, расхождение можно считать случайным. Это значит, что не отвергается гипотеза о соответствии данного ряда определенному закону распределения.

Для нашего примера по таблице значений вероятности определяем, что фактическому значению =0,66 соответствует вероятность P=0,776

Таким образом, с вероятностью 0,787 можно утверждать, что отклонение эмпирических частот от теоретических является случайным и распределение подчинено закону нормального распределения.