СВОЙСТВА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ И ЕГО СВОЙСТВА
При изучении зависимостей между двумя случайными величинами, необходимо всегда помнить одно важное положение: математика не в состоянии ответить на вопрос что от чего ЗАВИСИТ. С помощью корреляционного анализа устанавливается только факт наличия или отсутствия СВЯЗИ. С точки зрения математики постановка задачи зависит ли тяжесть заболевания от пола также правомочна, как и задача: зависит ли пол от тяжести заболевания. Очевидно, что вторая постановка задачи просто абсурдна. Поэтому, переходя от проверки наличия или отсутствия связи к гипотезам о зависимости, исследователь должен привлекать свои априорные профессиональные знания, лежащие вне компетенции математических методов.
Для ответа на вопрос о наличии или отсутствии связи между двумя случайными величинами рассчитываются по выборке различные коэффициенты связи и проверяется достоверность их отличия от нуля. Только в том случае, если показано, что тот или иной коэффициент связи достоверно отличается от нуля, можно говорить о наличии связи между изучаемыми величинами.
Существует довольно большое разнообразие коэффициентов связи, соответствующее разнообразию случайных величин. В данном рассмотрении мы будем принимать, что имеем дело с непрерывными случайными величинами, распределенными по нормальному закону. Именно эти условия часто реализуются для случайных величин, изучаемых в ходе медицинского или биологического исследования. Кроме того, будем принимать гипотезу, что между исследуемыми случайными величинами существует линейная связь. В этом случае коэффициент связи носит название коэффициента корреляции Пирсона.
Коэффициент корреляции Пирсона изменяется в пределах от -1 до +1. Значение коэффициента корреляции равное -1 или +1 означает, что между переменными существует строгая линейная связь, и эта связь может быть выражена математической формулой: . Если значение коэффициента корреляции по модулю находится ближе к 1, это означает наличие сильной связи, а если ближе к 0 — связь слабая или вообще отсутствует.
Следующий шаг состоит в том, чтобы ответить на вопрос: какая это связь прямая или обратная. Если значение коэффициента корреляции положительное, это означает, что связь прямая (то есть, при увеличении (уменьшении) одной случайной величины, увеличивается (уменьшается) другая). В противном случае, если значение коэффициента корреляции отрицательное, то связь обратная (увеличение (уменьшение) одной случайной величины приводит к уменьшению (увеличению) другой).
Относительно силы связи можно принять следующую градацию.
Таблица 2
Значения коэффициента корреляции | 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Характеристика силы связи | Слабая | Умеренная | Значительная | Сильная | Очень сильная |