Регрессионный анализ

При корреляционном анализе с помощью коэффициента корреляции можно выяснить тесноту (силу) и направление связи, но нельзя узнать, как количественно меняется результативный признак при изменении факториального на единицу измерения. Эта задача решается с помощью регрессионного анализа.

Регрессия – это изменение результативного признака (зависимой переменной, или функции У) при определённых изменениях факторного признака (независимой переменной или аргумента Х). Различают регрессию простую и множественную, по форме - линейную и криволинейную. Сущность регрессионного анализа состоит в том, чтобы построить линию (прямую в случае прямолинейной зависимости), которая наиболее точно выражала бы зависимость одного признака от другого.

Зависимость функции от аргумента при линейной регрессии выражается коэффициентом регрессии (в), который показывает, как в среднем изменяется (увеличивается или уменьшается, смотря по знаку в) результативный признак (функция) при изменении факториального признака (аргумента) на одну единицу измерения.

Коэффициенты линейной регрессии вычисляются по формулам:

и .

 

В нашем примере ,

.

Коэффициенты регрессии имеют знак коэффициента корреляции. Произведение коэффициентов регрессии равно квадрату коэффициентов корреляции (что используется для проверки расчётов коэффициентов регрессии):

; .

Чаще всего из двух коэффициентов регрессии вычисляют только один. При исследовании односторонней зависимости, например корреляции между урожаем У и количеством выпавших осадков Х (как в нашем примере), вычисляют только один коэффициент регрессии результативного признака , который показывает, как изменяется У при изменении Х на единицу измерения; выражается он в единицах У.

Так с увеличением количества осадков во II и III декадах июня на 1 мм урожайность яровой пшеницы повысится на 0,34 ц/га. Вычисление лишено смысла, мы его рассчитали для проверки вычислений коэффициентов регрессии. Затем находят ошибку коэффициента регрессии:

.

 

Критерий существенности коэффициента регрессии равен:

и мы не вычисляем, так как в данном примере , что свидетельствует о существенности регрессии.

Сопоставляя значения и можно при заданном уровне значимости (05 или 01) и числе степеней свободы v оценить существенность коэффициента регрессии результативного признака – . Если известен критерий существенности коэффициента корреляции и значимость его доказана, то существенным будет и коэффициент регрессии, так как .

Для наглядности корреляцию можно изобразить в виде линии регрессии.

Теоретическую линию регрессии можно построить двумя способами:

- графическим (с помощью прозрачной линейки), позволяющим приближённо выявить лишь общую тенденцию зависимости;

- аналитическим, используя уравнение линейной регрессии У по Х:

где и - средние арифметические признаков Х и У;

- коэффициент регрессии результативного признака.

Подставляя в это уравнение вычисленные значения , и , определяют формулу уравнения прямой линии ;

Подставляя значения и , получим:

По этому уравнению определяют теоретические усреднённые значения У (табл.23) для всех фиксированных значений Х (иногда ограничиваются определением значений У только для Xmin и Xmax).