Критерій згоди Пірсона (критерій ).
Нехай над дискретною випадковою величиною проведено незалежних випробувань, результати яких зведені в інтервальний варіаційний ряд:
Нехай відносні частоти , що відповідають цьому інтервальному ряду.
Відповідний емпіричний розподіл:
Нехай на основі аналізу емпіричного розподілу висунута гіпотеза про те, що теоретичний розподіл має вигляд і відповідна щільність є :
На основі цієї гіпотези будують теоретичний розподіл.
де розраховуються на основі формул для відповідного теоретичного розподілу, тобто , де середина інтервалу , - крок.
Ймовірності називають емпіричними ймовірностями, а теоретичними ймовірностями.
За міру розходжень між емпіричним і теоретичним розподілами вибирають число .
Вагові коефіцієнти вводяться тому, що одне і те саме відхилення , взяте за модулем, може бути незначним, якщо ймовірність велика, і значним якщо мала. Тому треба взяти обернено пропорційним ймовірностям . Пірсон показав, якщо припустити, що то при великих значеннях закон розподілу величини практично не залежить від функції розподілу випадкової величини і від числа випробувань , а залежить тільки від числа інтервалів і наближається до розподілуз ступенями свободи.
Нагадаємо, що у випадку коли кожна з незалежних випадкових величин має нормований нормальний закон розподілу, то випадкова величина матиме розподіл з ступенями свободи, щільність ймовірностей якої дорівнює
де гамма-функція.
При такому виборі коефіцієнтів міру розходження позначають через . Через позначають емпіричні частоти, через теоретичні частоти. Можна показати, що .
Чим менше відрізняються емпіричні та теоретичні частоти, тим меншою є величина . Таким чином критерій характеризує близькість теоретичного та емпіричного розподілів.
Алгоритм перевірки непараметричної статистичної гіпотези полягає в наступному:
1. задається рівень значимості
2. визначається число ступенів свободи де число параметрів функції розподілу плюс одиниця.
3. По числам та знаходиться число . Для цього використовуються спеціальні таблиці, або функція Excel ХИ2ОБР. Таблиця наведена у додатку.
4. На основі статистичних даних розраховується
5. У випадку якщо то гіпотеза приймається, якщо гіпотеза відхиляється.