Критерии согласия эмпирического ряда распределения с теоретическим
Эмпирические частоты распределения признака отличаются от теоретических частот. При изучении социально-экономических явлений совпадение эмпирического и теоретического рядов распределения крайне редки.
Важно установить, являются ли разности между эмпирическим и теоретическими частотами результатом действия случайных причин или эта разница существенна и обусловлена неправильно подобранной функцией теоретического распределения (т.е. предположение о распределении признака по данному закону необходимо признать ошибочным).
Для оценки близости эмпирического распределения к теоретическому (нормальному) используются специальные показатели, которые называются критериями согласия. Критерии согласия позволяют установить вероятность того, что расхождение между рядами распределения случайно, т.е. обусловлено случайными факторами.
Принимается нулевая гипотеза (т.е. предположение о чем-либо) о том, что расхождение случайно. Вероятность нулевой гипотезы обозначается Р0:
если Р0>0,05 – то различия между рядами случайны;
если Р0<0,05 – нулевая гипотеза отвергается и доказывается то, что расхождение между рядами вызвано неправильно подобранным законом распределения.
Для оценки близости распределения к нормальному используются следующие критерии:
1. Критерий Хи-квадрат Пирсона ();
2. Критерий Романовского на базе ;
3. Критерий Колмогорова и Смирнова – критерий.
Критерий Пирсона рассчитывается по формуле:
=∑,
где – частоты эмпирического ряда распределения;
– частоты теоретического ряда распределения.
При этом действуют следующие ограничения:
1. должна быть больше 100
2. количество частот в интервале должно быть не менее 5.
При исчислении используется понятие: число степеней свободы, под которым понимают количество независимых переменных, которые могут принимать произвольные значения, не изменяя заданной характеристики (средней величины).
Число степеней свободы рассчитывается:
где m – число групп;
r – число параметров (характеристик теоретического закона распределения); обычно используют 2 параметра: и .
По таблице «Критические значение критерия Пирсона при разном уровне вероятности P и различном числе степеней свободы» на основе заданной вероятности p=0,95 и k=4 определяем табличное значениеПирсона:
Возникает 2 ситуации:
1. если , то отклонение между частотами является случайным и несущественным, а теоретическое распределение хорошо воспроизводит эмпирическое, т.е. нулевая гипотеза подтверждается;
2. если , то отклонение фактических частот от теоретических является существенным и эмпирический ряд распределения не подчиняется закону нормального распределения; нулевая гипотеза отвергается.
С вероятностью 0,95 можно утверждать, что распределение предприятий по урожайности картофеля подчиняется закону нормального распределения, различие между частотами случайно.
2 вариант оценки Пирсона: используется таблица « Таблица вероятностей Пирсона».
Критерий Романовского (на основе) рассчитывается по формуле:
Если p <3, расхождение между частотами случайно, эмпирическое распределение подчиняется нормальному закону распределения;
если p >3, расхождение рядов существенно, эмпирическое распределение не подчиняется нормальному закону распределения.
Критерий Колмогорова – Смирнова (критерий):
,
где D – наибольшая разность между накопленными частотами теоретического и эмпирического рядов;
– сумма накопленных частот.
Для величины математиком Н.В. Смирновым были вычислены вероятности Р0 того, что расхождения несущественно.
По специальным таблицам вероятностей определяют близость к 1, с которой можно утверждать, что отклонения фактических частот от теоретических являются случайными, а данное распределение является нормальным. Если Р0>0,05, расхождение можно считать случайным. Это значит, что не отвергается гипотеза о соответствии данного ряда определенному закону распределения.
Для нашего примера по таблице значений вероятности определяем, что фактическому значению =0,66 соответствует вероятность P=0,776
Таким образом, с вероятностью 0,787 можно утверждать, что отклонение эмпирических частот от теоретических является случайным и распределение подчинено закону нормального распределения.