U-критерій Манна-Уїтні

Непараметричний U-критерій Манна-Уїтні дозволяє оцінити достовірність відмінностей у незалежних вибірках, якщо дані в них представлені в ранговій шкалі. Цей критерій слід застосовувати і в тому випадку, якщо дані представлені в метричних шкалах, але не вкладаються в криву нормального розподілу. При цьому слід звернути на обмеження у використанні критерію: у кожній вибірці має бути не менше трьох і не більше 60 спостережень.

Обидві вибірки об'єднуються, здійснюється ранжування за принципом «меншому значенню – менший ранг», потім об'єднана вибірка знову розщеплюється, але зі збереженням значень рангів, присвоєних при об'єднаному ранжируванні.

Як приклад пропонується проаналізувати 20 значень з таблиці з метою з'ясувати, чи існують для хлопчиків і дівчаток достовірні відмінності між результатами субтестів на обізнаність.

Формулюються статистичні гіпотези.

Н0: різниця між показниками субтеста обізнаності у хлопчиків і дівчаток статистично не достовірна.

Н1: різниця між показниками субтеста обізнаності у хлопчиків і дівчаток статистично достовірна.

 

ж ж ч ж ж ж ч ж ж ж ж ч ж ж ч ж ч ж ч ч

 

ж ж ч ч ж ж ч ч ж ж ч ж ч ж ж ж ж ч ж ж
3,5 3,5 5,5 5,5 7,5 7,5 12,5 12,5

 

Порахувати рангові суми

Обізнаність ч Ранг Обізнаність ж Ранг
   
   
3,5    
3,5    
    5,5
    5,5
7,5    
7,5    
   
   
   
12,5    
    12,5
   
   
   
   
   
   
   
  Ʃr=60,5   Ʃr=149,5

 

Загальна сума рангів: 60,5+149,5=210. Розрахункова сума:

Визначається емпіричне значення критерію за формулою:

де n1 – об’єм першої вибірки;

n2 – об’єм другої вибірки;

Тх – більша з рангових сум;

nх – об’єм групи з більшою сумою рангів.

 

Згідно з таблицями критичних значень, при n1=13 і n2=7,

Uкp (для р <0,05) = 20 і

Uкр (для р <0,01) = 13.

Критерій Манна-Уїтні відрізняється від більшості інших критеріїв тим, що для спростування нульової гіпотези емпіричне значення повинно бути менше або дорівнює критичного (подібна закономірність типова також для Т-критерію Вілкоксона і критерію знаків G). Тобто використовується наступний принцип: UемпUкp = ˃ Н1!

У нашому випадку Uемп = 32,5. Тобто Uемп > Uкp (р<0,05)=>Н0! Таким чином, наявність достовірних відмінностей між показниками обізнаності у хлопчиків і у дівчаток не встановлено. Якщо необхідно порівняти не два, а більшу кількість розподілів, то в цьому випадку використовується Н-критерій Краскела-Уоллеса.

 

Н-критерій Краскела-Уоллеса (Kruskal-Wallis)

Н-критерій Краскела-Уоллеса призначається для оцінки відмінностей за будь-яким показником між трьома і більше вибірками. Обмеження у використанні критерію наступне: у кожній з вибірок має бути не менше трьох спостережень (якщо всього два спостереження, то слід застосувати U-критерій).

Як і у випадку з U-критерієм, вибірки об'єднуються, ранжуються за принципом «меншому значенню – менший ранг», потім об'єднана вибірка знову розщеплюється, але значення рангів присвоєних при об'єднаному ранжируванні зберігаються.

Формула критерію виглядає наступним чином:

де R – це суми рангів по групах; k – кількість груп; nk – об’єм груп; n – об’єм об'єднаної вибірки.

де Т – це суми рангів по кожній групі; N – загальна кількість досліджуваних в об’єднаній вибірці; n – кількість досліджуваних в кожній групі.

У разі, коли у нас k ≥ 4, для визначення критичного показника використовується таблиця критичних значень «хі-квадрат», так як при кількості груп більше трьох розподіл H-критерію наближається до розподілу χ2. Якщо k = 3, то слід або взагалі застосувати U-критерій для попарного порівняння, або використовувати таблицю представлену в підручнику Е. В. Сидоренко. Автор публікує таблицю критичних значень H-критерію стосовно до k = 3, містить для кожної комбінації об’ємів груп до 6 градацій рівня значущості.

Ступінь свободи Н-критерію має формулу: df = k – 1.

Постановка завдання: необхідно з'ясувати, чи є достовірні відмінності в ступені стресостійкості у представників чотирьох груп студентів. У педагогічному вузі протестували студентів чотирьох різних факультетів старших курсів навчання за допомогою «Методики визначення стресостійкості та соціальної адаптації» Холмса-Раге. Дані зведені в таблицю.

 

Факультет Тестові бали
Психолого-педагогічний
Психолого-педагогічний
Психолого-педагогічний
Фізики
Фізики
Фізичної культури
Фізичної культури
Фізичної культури
Фізичної культури
Фізичної культури
Музики
Музики
Музики

 

Наступний етап – ранжування цієї об'єднаної вибірки і її розщеплення на чотири групи.

Фізичної культури Фізики Психолого-педагогічний музики
Бал Ранг Бал Ранг Бал Ранг Бал Ранг
           
           
           
           
           
           
            7,5
        7,5    
           
           
           
           
           
  Ʃr1=15   Ʃr2=15   Ʃr3=29,5   Ʃr4=31,5

 

Загальна сума рангів = 15+15+29,5+31,5 = 91. Розрахункова сума рангів

Обчислюються також об’єми груп:

n1 = 5,

n2 = 2,

n3 = 3,

n4 = 3.

Їх сума говорить про загальну кількість обстежених n = 13.

Потім обчислюється емпіричне значення критерію і ступеню свободи:

 

 

df = k–1 = 4–1 =3

Оскільки k=4, для визначення критичного значення критерію використовуємо таблицю розподілу статистики χ2.

χ2кр (р≤0,05) = 7,815

(р≤0,01) = 11,345

Немп = 9,4;

Нкр (для р <0,05) = 7,815;

Немп > Нкр (р <0,05)=˃Н1! Таким чином, на рівні статистичної значущості встановлено наявність достовірних відмінностей між показниками стресостійкості у студентів різних факультетів.