Множественная (многофакторная) регрессия.

Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т.е. требуется определить аналитическое выражение связи между результативным признаком (У) и факторными признаками (х1, х2, … , хк), найти функцию

Построение моделей множественной регрессии включает 3 этапа:

· выбор формы связи (уравнения регрессии);

· отбор факторных признаков;

· обеспечение достаточного объема совокупности для получения оценок.

Практика построения многофакторных моделей показывает, что все реально существующие зависимости можно описать, используя 5 типов моделей:

1) линейная -

2) степенная -

3) показательная -

4) параболическая -

5) гиперболическая -

где Y1,2,3,…,k - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

х1, х2, …, хк - факторные признаки;

а0, а1, …, ак - параметры модели (коэффициенты регрессии)

Важным этапом построения является отбор и последующее включение факторных признаков. Сложность заключается в том, что все факторные признаки находятся в зависимости один от другого. Отбор признаков осуществляется при помощи двух методов: метода экспертных оценок и шаговой регрессии.

Метод экспертных оценок основан на расчете и анализе непараметрических показателей связи: ранговых коэффициентов корреляции Спирмена, Кендалла и конкордации.

Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициенты регрессии не изменяются (или меняются несущественно), то включение данного признака в уравнение регрессии необходимо. Если же при включении в модель факторного признака коэффициенты регрессии меняют величину, свой знак на противоположный, множественный коэффициент корреляции не возрастает, то данный факторный признак нецелесообразен.

Аналитическая форма выражения связи результативного признака и ряда факторных называется уравнением регрессии. Параметры уравнения могут быть найдены графически или аналогично парной корреляции - методом наименьших квадратов.

Для линейной зависимости уравнение для нахождения параметров имеет вид:

Для нахождения минимума функции продифференцируем выражение по каждому параметру и частные производные приравняем к нулю. Получаем систему уравнений:

Например, по параметру а1 уравнение будет

Делая соответствующие преобразования по всем значениям параметров аi получаем

Отсюда имеем

В результате таких преобразований система нормальных уравнений с k неизвестными имеет вид:

Оценка влияния каждого факторного признака на результативный может быть затруднена, если факторные признаки различны по своей сущности и имеют разные единицы измерения. В этих случаях все значения исследуемых признаков переводятся в стандарты по формуле:

где хi - значения признака в натуральном масштабе.

 

Уравнение множественной регрессии в стандартизованном масштабе следующее:

(18)

Параметры многофакторной регрессии в стандартизованном масштабе определяются методом наименьших квадратов аналогично рассмотренному ранее.