Коефіцієнт лінійної кореляції Пірсона (rxy).
Лінійна кореляція
Визначення значимості кореляції
Класифікація коефіцієнтів кореляції за значимістю
Класифікація коефіцієнтів кореляції за силою
Класифікації коефіцієнтів кореляції
Коефіцієнти кореляції характеризуються силою і значущістю. Класифікація коефіцієнтів кореляції за силою
Сильна | r˃0,70 |
Середня | 0,50˂r˂069 |
Помірна | 0,30˂r˂0,49 |
Слабка | 0,20˂r˂0,26 |
Дуже слабка | r˂0,19 |
Високо значима кореляція | r відповідає рівню високої статистичної значимості р≤0,01 |
Статистично значима кореляція | r відповідає рівню статистичної значимості р≤0,05 |
Незначима кореляція | r не досягає рівня статистичної значимості р˃0,1 |
· якщо величина коефіцієнта кореляції між змінними -0,36, то це слабка негативна кореляція, і швидше за все ми не будемо приймати її в розрахунок;
· якщо величина коефіцієнта кореляції дорівнює 0, отже змінні не пов'язані між собою;
· якщо величина коефіцієнта кореляції між змінними дорівнює 0,25 то це дуже слабка кореляція і в більшості випадків ми не беремо її в розрахунок;
· якщо величина коефіцієнта кореляції між змінними дорівнює 0,75 то це висока кореляція і в своїх інтерпретаціях нам варто звернути на неї увагу;
· якщо величина коефіцієнта кореляції дорівнює 1, отже повністю взаємопов'язані.
Не слід плутати ці класифікації, так як вони визначають різні характеристики. Сильна кореляція може виявитися випадковою і, значить, недостовірною. Особливо часто це трапляється у вибірці з малим об'ємом. А у великій вибірці навіть слабка кореляція може виявитися високозначимою.
Після обчислення коефіцієнта кореляції необхідно висунути статистичні гіпотези:
Н0: показник кореляції значимо не відрізняється від нуля (є випадковим).
H1: показник кореляції значимо відрізняється від нуля (є невипадковим).
Перевірка гіпотез здійснюється шляхом порівняння отриманих емпіричних коефіцієнтів з табличними критичними. Якщо емпіричне значення досягає критичного рівня або перевищує його, то нульова гіпотеза відхиляється: rемп˃rкр відхиляється Н0, приймаємо Н1. У таких випадках роблять висновок, що виявлений достовірно значущий зв'язок між показниками.
Якщо емпіричне значення не перевищує критичного, то нульова гіпотеза не відхиляється: rемп˂rкр. приймається Н0. У таких випадках роблять висновок, що не встановлена наявність достовірного зв'язку між показниками.
Коефіцієнт кореляції Пірсона називається також коефіцієнтом лінійної кореляції. Він дозволяє визначити силу зв'язку між двома ознаками, виміряними в метричних шкалах.
Вихідний принцип коефіцієнта кореляції Пірсона – використання моментів творення (відхилень значення змінної від середнього значення):
Якщо сума моментів творення велика і позитивна, то х і у зв'язані прямою залежністю; якщо сума велика і негативна, то х і у сильно пов'язані зворотною залежністю; нарешті, у разі відсутності зв'язку між x і у сума добутків моментів близька до нуля.
Для того щоб статистика не залежала від обсягу вибірки, береться не сума добутків моментів, а середнє значення. Однак поділ проводиться не на об’єм вибірки, а на число ступенів свободи n – 1.
Величина є мірою зв’язку між x та y та називається коваріацією x та y.
Для того щоб стандартизувати міру зв'язку, необхідно позбавити коваріацію від впливу стандартних відхилень. Для цього треба розділити Sxy на Sx і Sy:
Послідовність розрахунків можна продемонструвати на наступному прикладі. Отже, необхідно:
Обчислити значення кореляції між показниками росту в сантиметрах і ваги в кілограмах у представників групи студентів.
Поставити питання про достовірність цього коефіцієнта. Для вирішення другого завдання необхідно попередньо сформулювати нульову і альтернативну гіпотези:
Н0: кореляція між показниками росту та ваги значно не відрізняється від нуля (є випадковою).
Н1: кореляція між показниками росту та ваги значно відрізняється від нуля (є невипадковою).
Дані заносяться в таблицю, при цьому бажано, щоб один з стовпців значень ознаки (показники зростання або ваги) був впорядкований.
№ | xi (ріст) | yi (вага) | xi –M | (xi –M)2 | yi –M | (yi –M)2 | (xi –M) (yi –M) |
-7 | -11 | ||||||
-6 | -9 | ||||||
-6 | -1 | ||||||
-3 | -8 | ||||||
-2 | -2 | ||||||
-4 | -16 | ||||||
n=10 | M=166 | M=58 | Ʃ=292 | Ʃ=558 | Ʃ=280 |
Висновок: можна оцінити зв'язок між показниками росту і ваги як сильну позитивну.