Особливі випадки використання критерію (поправка на неперервність).
Іноді потрібно перетворення «великих» таблиць кростабуляціі в чотирьох клітинні (тобто з 4 полями). Ця процедура потрібна при роботі з спрямованими гіпотезами (приклад наведено нижче) або для обчислення коефіцієнтів кореляції (приклади наведено в наступному розділі). Отже, ми встановили, що представники різних статей частіше надають перевагу різним напрямам навчання. А чи можна припустити, що для юнаків більш типовим є вибір математичного профілю навчання або для дівчат - гуманітарного? Для цього буде потрібно «здавити» вихідну таблицю і перетворити її в 4-клітинну. І сформулювати спрямовані статистичні гіпотези. Виникає питання: якими з двох стовпчиків слід пожертвувати для їх об'єднання? Очевидно, тими, де різниця між «чоловічими» і «жіночими» частотами менша.
математика | Природні науки | Гуманітарні науки | |
Юнаки | |||
Дівчата | |||
Різниця частот |
Перетворена таблиця після підрахунку сум частот набуває наступного вигляду:
Математика+природничі науки | Гуманітарні науки | Ʃ | |
Юнаки | |||
Дівчата | |||
Ʃ |
Тепер ми можемо сформулювати спрямовані гіпотези .
Н0: частота вибору дівчатами гуманітарного профілю навчання значуще не перевершує частоту вибору юнаками математичного і природничо-наукового профілю.
Н1: частота вибору дівчатами гуманітарного профілю навчання значимо перевершує частоту вибору юнаками математичного і природничо-наукового профілю.
Для чотирьох клітинних таблиць крос-табуляції при підрахунку χ2 потрібно вводити поправку Йєтса на безперервність. Поправка полягає у зменшенні взятої за модулем різниці між емпіричною та теоретичною частотами на 0,5 для кожної клітини таблиці:
В цьому випадку таблиця буде мати наступний вигляд.
fе | fT | fT | fе – fT | ǀfе – fTǀ-0,5 | (ǀfе – fTǀ-0,5)2 | (ǀfе – fTǀ-0,5)2/ fT |
31·47/65 | 22,42 | 5,58 | 5,08 | 25,85 | 1,15 | |
31·18/65 | 8,68 | -5,58 | 5,08 | 25,81 | 3,01 | |
34·47/65 | 24,58 | -5,58 | 5,08 | 25,81 | 1,05 | |
34·18/65 | 9,42 | 5,58 | 5,08 | 25,85 | 2,75 | |
7,96 |
Тепер слід порівняти емпіричне значення критерію з критичним, df – 1 (у таблиці 2 х 2 він завжди буде дорівнювати = 1). Відповідні критичні значення наведені в Табл. ІХ.
χ2кр(р≤0,01) = 6,635 χ2емп = 7,96
χ2емп ˃ χ2кр
Альтернативна гіпотеза доведена, дівчата дійсно частіше надають перевагу гуманітарному профілю подальшого навчання. А чи можна зробити припущення про перевагу юнаками математичного профілю? Для цього нам необхідно буде знову переробити початкову таблицю і об'єднати стовпці «Природні науки» та «Гуманітарні науки». Дану задачу студентам пропонується вирішити самостійно.
4. Критерій Колмогорова – Смірнова (l)
Критерій Колмогорова-Смірнова заснований на тому ж принципі, що і критерій χ2 Пірсона, але передбачає зіставлення накопичених частот експериментального і теоретичного розподілів. Обчислюється як відношення максимальної різниці (без урахування знака) між теоретичною та експериментальною накопиченою частотою до кореню квадратному з чисельності вибірки.