Статистичне моделювання зв’язку кореляційно-регресійним методом

У загальному вигляді завдання статистики при вивченні зв’язку полягає не тільки в оцінці його наявності, напрямку і сили, але й у визначенні форми, аналітичного виразу впливу факторних ознак на результативний показник. Для його вирішення застосовують методи кореляційно-регресійного аналізу.

До основних завдань кореляційно-регресійного аналізу належать такі:

- встановлення наявності зв’язку між досліджуваними ознаками;

- виявлення виду функції зв’язку;

- знаходження параметрів функції зв’язку;

- оцінка достовірності отриманих результатів.

Наведений перелік завдань визначає відповідну послідовність здійснення процедури кореляційно-регресійного аналізу зв’язку між статистичними показниками. При цьому термін “кореляція” використовується для оцінки щільності зв’язку між ознаками, а термін “регресія” - для опису виду і параметрів функції зв’язку, регресійної моделі.

При вивченні зв’язку економічних показників частіше всього використовуються рівняння прямолінійного і криволінійного зв’язку.

В теорії статистики найбільш вивченою є методологія парної кореляції, яка розглядає вплив варіації факторної ознаки Х на результативну ознаку У. Аналітично зв’язок між двома показниками описується рівняннями:

прямої – у = а + bх; гіперболи – у = а +b/х;

параболи – у = а + bх +сх2; показової – у = аbх;

степеневої – у = ах в,

в яких:у – теоретичне значення результативної ознаки;

а, b, с – коефіцієнти рівняння регресії.

Повернемось до нашого прикладу залежності продуктивності праці від її енергоозброєності і знайдемо теоретичне рівняння зв’язку, яке має, як встановлено графічно лінійний характер. Знайти теоретичне рівняння зв’язку, означає визначить його параметри. При класичному підході до вирішення такого завдання застосовують метод найменших квадратів, який базується на передбаченні незалежності окремих спостережень один від одного.

Сутність методу найменших квадратів полягає в тому, що знаходяться такі значення коефіцієнтів рівняння регресії, при яких сума квадратів відхилень фактичних значень результативної ознаки від значень ознаки, розрахованих за рівнянням (у = а + bх), буде найменшою зі всіх можливих:

.

Вирівнювання за прямою способом найменших квадратів приводить до наступної системи нормальних рівнянь:

n– кількість спостережень у кожному з двох порівнювальних рядів;

Σх – сума значень факторної ознаки;

Σх2 – сума квадратів значень факторної ознаки;

Σу – сума значень результативної ознаки;

Σух - сума добутків значень факторної ознаки на значення результативної ознаки.

У нашому прикладі: n=25; Σх=253,7; Σх2=2713,25; Σу=161; Σух=1753,1.

Нормальні рівняння для знаходження параметрів прямої для наведеного прикладу приймають вигляд:

Помножимо перше рівняння на 10,148 (253,7 : 25), одержимо

1633,828 = 253,7а + 2574,548b.

Віднімемо з другого рівняння знову одержане, маємо:

138,702b = 119,272.

Звідки b=119,272/138,702=0,86. Підставимо значення в перше рівняння, одержимо: 161 = 25а + 253,7 ×0,86

161 = 25а + 218,2.

Звідки, а = -57,2/25 = -2,29.

Знайдене теоретичне рівняння зв’язку між енергоозброєністю і продуктивністю праці буде таким:

у = 0,86х – 2,29.

Теоретичні рівні продуктивності праці визначають згідно зі знайденим рівнянням (табл. 9.7). На першому заводі рівень продуктивності праці становитиме: 0,86 × 6 –2,29 = 2,9 і т.д.

Таблиця 9.7