Регрессионный анализ
При корреляционном анализе с помощью коэффициента корреляции можно выяснить тесноту (силу) и направление связи, но нельзя узнать, как количественно меняется результативный признак при изменении факториального на единицу измерения. Эта задача решается с помощью регрессионного анализа.
Регрессия – это изменение результативного признака (зависимой переменной, или функции У) при определённых изменениях факторного признака (независимой переменной или аргумента Х). Различают регрессию простую и множественную, по форме - линейную и криволинейную. Сущность регрессионного анализа состоит в том, чтобы построить линию (прямую в случае прямолинейной зависимости), которая наиболее точно выражала бы зависимость одного признака от другого.
Зависимость функции от аргумента при линейной регрессии выражается коэффициентом регрессии (в), который показывает, как в среднем изменяется (увеличивается или уменьшается, смотря по знаку в) результативный признак (функция) при изменении факториального признака (аргумента) на одну единицу измерения.
Коэффициенты линейной регрессии вычисляются по формулам:
и .
В нашем примере ,
.
Коэффициенты регрессии имеют знак коэффициента корреляции. Произведение коэффициентов регрессии равно квадрату коэффициентов корреляции (что используется для проверки расчётов коэффициентов регрессии):
; .
Чаще всего из двух коэффициентов регрессии вычисляют только один. При исследовании односторонней зависимости, например корреляции между урожаем У и количеством выпавших осадков Х (как в нашем примере), вычисляют только один коэффициент регрессии результативного признака , который показывает, как изменяется У при изменении Х на единицу измерения; выражается он в единицах У.
Так с увеличением количества осадков во II и III декадах июня на 1 мм урожайность яровой пшеницы повысится на 0,34 ц/га. Вычисление лишено смысла, мы его рассчитали для проверки вычислений коэффициентов регрессии. Затем находят ошибку коэффициента регрессии:
.
Критерий существенности коэффициента регрессии равен:
и мы не вычисляем, так как в данном примере , что свидетельствует о существенности регрессии.
Сопоставляя значения и можно при заданном уровне значимости (05 или 01) и числе степеней свободы v оценить существенность коэффициента регрессии результативного признака – . Если известен критерий существенности коэффициента корреляции и значимость его доказана, то существенным будет и коэффициент регрессии, так как .
Для наглядности корреляцию можно изобразить в виде линии регрессии.
Теоретическую линию регрессии можно построить двумя способами:
- графическим (с помощью прозрачной линейки), позволяющим приближённо выявить лишь общую тенденцию зависимости;
- аналитическим, используя уравнение линейной регрессии У по Х:
где и - средние арифметические признаков Х и У;
- коэффициент регрессии результативного признака.
Подставляя в это уравнение вычисленные значения , и , определяют формулу уравнения прямой линии ;
Подставляя значения и , получим:
По этому уравнению определяют теоретические усреднённые значения У (табл.23) для всех фиксированных значений Х (иногда ограничиваются определением значений У только для Xmin и Xmax).