Рангова кореляція.
При вимірюванні зв’язку між ознаками порядкової шкали використовується коефіцієнт рангової кореляції. Розрахунок його ґрунтується на різниці рангів , де
та
- ранги елементів сукупності відповідно за першою та другою ознаками. Його обчислюють за формулою Спірмена
де n - число елементів сукупності.
Цей коефіцієнт має такі самі властивості, як і лінійний коефіцієнт кореляції, і змінюється в межах від -1 до +1, водночас оцінює тісноту зв’язку та вказує його напрям.
При повному прямому зв’язку , тобто відхилення між рангами
. Отже
і
=1.
При повному зворотному зв’язку (ранги двох рядків розташовані у зворотньому напрямку) =-1.
Якщо два і більше елементи сукупності мають однакові значення ознаки, їм надається середній ранг. Наприклад, 2, 3 і 4 елементи сукупності мають друге за розміром значення ознаки. Тоді їм надається середній ранг 1∕3*(2+3+4) = 3, а тісноту зв’язку можна оцінити за формулою лінійного коефіцієнта кореляції.
Для прикладу використаємо дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію (табл.4).
Таблиця 4
Дані про ранги 10 осіб згідно з їх оцінками на вступних іспитах у вуз і середніх балів за першу екзаменаційну сесію
Студент | Ранги | d | d2 | |
Вступні іспити | Екзаменаційна сесія | |||
А | +2 | |||
Б | ||||
В | ||||
Г | -1 | |||
Д | -1 | |||
Е | +1 | |||
Ж | -1 | |||
З | ||||
І | -1 | |||
К | +1 | |||
Разом![]() | х |
=1-
Це свідчить про прямий зв’язок між ознаками (результатами двох екзаменів) і досить високий його рівень.
Можна перевірити істотність зв’язку. Критичне значення коефіцієнта рангової кореляції для =0,05 і n = 10
0,95(10) = 0,564. Фактичне значення
більше критичного. Значить істотність зв’язку доведена.
Для зворотних зв’язків, тобто коли <1, з критичним значенням порівнюється абсолютне значення
.
Рангові коефіцієнти мають як переваги, так і недоліки порівняно з параметричними. Не потрібно дотримуватись певних математичних передумов відносно розподілу ознак (передумови нормальності розподілу).
Однак, оскільки використовується не значення ознаки, а ранг ознак, втрачається інформація про взаємозв’язок.
Завдання.
Підсумкові результати в кросах (ранг Х) і лижній гонці (ранг У) у 10 лижників розподілились так: