Коефіцієнт детермінації

Величину можна представити у вигляді двох складових: розрахункового значення «і» відліку та помилки

;

, підведемо до квадрату ліву та праву частину і просумуємо їх по «і».

: (2*)

Розглянемо вираз

Пам’ятаємо, що згідно умов Гауса-Маркова , тоді вираз (2*) перетворюється в

(2**),

де – загальна сума квадратів (suma sqrt total);

– сума квадратів помилок, що пояснюється регресією (регресійна сума квадратів, suma sqrt regresic);

– сума квадратів помилок, що не пояснюється за допомогою регресії (suma sqrt error).

SST=SSR+SSE (2,3)

(2,4)

де – коефіцієнт детермінації.

Аналізуючи рівняння (2,4) робимо висновок, що коефіцієнт регресії завжди невід’ємний, не має одиниці виміру і не перевищує одиниці.

Ввести коефіцієнт детермінації можна іншим чином. Після побудови регресивної моделі можна записати

Знайдемо дисперсію у

Можна довести (довести самостійно), що . Таким чином

.

Це означає, що дисперсію випадкової величини у можна розкласти на дві складові: яка «пояснюється» регресією () та «не пояснюється» її . Тоді .

Зв’язок коефіцієнтів кореляції і детермінації можна виразити

В порівнянні з коефіцієнтом кореляції коефіцієнт детермінації характеризує зв’язок незалежно від його виду: лінійний або нелінійний. Але за таку перевагу доводиться платити втратою інформації про напрямок зв’язку.

Коефіцієнт детермінації використовують тільки з позначкою «R2». Запис не вірний, так як – це є ознака множинного коефіцієнта кореляції.

Індекс кореляції – характеризує нелінійний зв’язок між змінними

де – дисперсія «не пояснювальної» частини помилки;

– дисперсія загального (тотального) відхилення.

Тоді . звідси, індекс кореляції не від’ємний, не має одиниць виміру і не перевищує одиниці.