Кореляція
ДОСЛІДЖЕННЯ ВЗАЄМОЗВ’ЯЗКУ ОЗНАК
Кореляція – це узгодженість зміни ознак. Якщо два явища змінюються синхронно і ці зміни можна виразити кількісно, то між показниками цих явищ спостерігатиметься кореляція. Наприклад, кореляція може спостерігатися між ростом і вагою людей (велика ймовірність, що чим вища людина, тим більшою буде його вага). Або між рівнем інтелекту і показниками шкільної успішності.
Нагадаємо, що кореляційний зв'язок між змінними не завжди означає зв'язок причинно-наслідковий. Іншими словами, якщо змінні пов'язані один з одним, то на цій підставі ми не можемо зробити висновок про те, що одна з них залежить від іншої. Так, наприклад, на підставі антропометричних вимірювань встановлена позитивна кореляція між ростом і вагою суб'єктів у численної вибірці піддослідних. Проте ми не можемо сказати на цей рахунок, що вага залежить від зростання або, навпаки, зростання залежить від ваги. Швидше за все, і те й інше залежить від третьої змінної - в даному випадку від конституціональних особливостей людини, що задаються генетичними факторами. Цілком аналогічно, виявивши кореляцію між рівнем нейротизму і особистісної тривожності, ми не можемо говорити, що вони знаходяться в причинно-наслідковій залежності один від одного.
У разі ж якщо ці точки не шикуються по прямій лінії, а утворюють «хмару», коефіцієнт кореляції за абсолютною величиною стає менше одиниці і в міру округлення цієї хмари наближається до нуля:
У гуманітарних науках кореляція вважається сильною, якщо її коефіцієнт вище 0,60, якщо ж він перевищує 0,90, то кореляція вважається дуже сильною. Однак для того, щоб можна було робити висновки про зв'язки між змінними, велике значення має об'єм вибірки: чим вибірка більша, тим вірогідніша величина отриманого коефіцієнта кореляції. Існують таблиці з критичними значеннями коефіцієнта кореляції Браве-Пірсона та Спірмена для різного числа ступенів свободи (воно дорівнює числу пар за вирахуванням 2, тобто n-2). Лише в тому випадку, якщо коефіцієнти кореляції більші цих критичних значень, вони можуть вважатися достовірними. Так, для того щоб коефіцієнт кореляції 0,70 був достовірним, в аналіз має бути узята не менше 8 пар даних (h=n-2=6) при обчисленні r (див. табл. 4 у Додатку) і 7 пар даних (h=n-2=5) при обчисленні rs.
Кореляції бувають як лінійні, так і нелінійні. Нелінійними можуть бути, наприклад, крива мотивації Іеркса-Додсона (параболічна залежність між рівнем мотивації та ефективністю виконання завдання), гіперболічна крива забування Еббінгауза, логарифмічне уявлення закону Вебера-Фехнера. Лінійну кореляцію можна кількісно виміряти. Ступінь зв'язку між ознаками виражається величиною, яка називається коефіцієнтом кореляції. Значення даного коефіцієнта (позначається найчастіше буквою R або r) можуть перебувати в діапазоні від –1 до +1. У випадку прямогопропорційного зв'язку однієї ознаки з іншою значення коефіцієнта наближається до одиниці. Негативний коефіцієнт свідчить про протилежну спрямованість варіювання ознак: при зміні однієї в бік збільшення інша зменшується. Наприклад, показники інтелектуальної ригідності негативно корелюють з рівнем інтелекту, і позитивно – з показниками інтелектуальної наполегливості. Величина, близька до нуля, говорить про відсутності виявленого взаємозв'язку між ознаками.
Дані, отримані при кореляційному дослідженні, можна представити у вигляді діаграми розсіювання, на якій кожна змінна відкладається на своїй осі, а кожна точка відображає одиночне вимірювання.
Нижче зображений приклад графічного подання лінійної кореляції між показниками нейротизму (за тестом Айзенка) і тривожності (за опитувальником Тейлора) у представників групи студентів. Чим ближче коефіцієнт кореляції прагне до +1 або до –1, тим більшою мірою точки на графіку прагнуть вишикуватися в рівну лінію.
Коефіцієнт кореляції – це безрозмірна величина, і вона не залежить від масштабів вимірювання. Наприклад, сила зв'язку між ростом і вагою буде однією і тою ж незалежно від того, чи проводилися вимірювання в дюймах і фунтах або в сантиметрах і кілограмах.
Залежно від типу шкали, в якій виміряні змінні, використовують різні види кореляції. Таким чином, виділяють наступні види кореляції: лінійну (метричну), рангову і міжномінативними змінними (Категоріальна (номінативна) змінна, кожне значення якої вказує на належність об'єкта до певної групи (категорії). Категоріальна змінна не є кількісною. Вона поділяє всі об'єкти на непересічні групи за певною ознакою (стать, хобі, клас тощо), але не дозволяє порівнювати об'єкти за рівнем вираження цієї ознаки).
Якщо дані виміряні в метричних шкалах і укладаються в криву нормального розподілу, то слід застосовувати метод лінійної кореляції. При цьому використовується обчислення коефіцієнта кореляції за К. Пірсоном.
Якщо метричні дані не підпорядковуються закону нормального розподілу, то рекомендується перетворити метричні дані в рангові і застосувати метод рангової кореляції. Цей же метод використовується при роботі зі змінними, виміряними в порядковій шкалі. У цьому випадку використовують обчислення коефіцієнта рангової кореляції за Спірменом або за Кендалом.