Проверка значимости коэффициентов регрессии
Напомним вид уравнения множественной линейной регрессии:
(1)
В программе «Регрессия» коэффициенты регрессии приведены в строке «Коэффициенты». Строка «Y-пересечение» - свободный член
; в других строка ниже:
(«Переменная Х1»);
(«Переменная Х2»). и т.д. Отметим, что на рис.2 приведен пример расчета парной регрессии
, которая является частным случаем множественной.
Возможна ситуация, когда часть вычисленных коэффициентов регрессии не обладает необходимой степенью значимости. В этом случае значения рассматриваемых коэффициентов будут меньше величины их стандартной ошибки.
Поэтому наряду с проверкой адекватности полученного уравнения регрессии в целом (по значимости коэффициента детерминации ) необходимо выполнить проверку значимости каждого коэффициента регрессии.
Проверку значимости коэффициентов регрессии выполняют с помощью -критерия Стьюдента:
, (2)
где - значение рассматриваемого коэффициента регрессии;
;
- стандартная ошибка (погрешность) коэффициента
;
- расчетное значение коэффициента Стьюдента.
Формула для определения громоздкая и ее приводить не будем.
Коэффициент регрессии считается значимым при выполнении условия:
(3)
где - табличное значение коэффициента Стьюдента, выбираемое в зависимости от уровня значимости
(обычно
) и степени свободы
. (4)
Здесь - количество факторов
;
- число экспериментальных данных. В Excel для определения
используется статистическая функция:
=СТЬДРАСПОБР(;
).
В программе «Регрессия» значения приведены в столбце «Стандартная ошибка»; значения
- в столбце «
-статистика». Вместо условия (3) в данной программе вычисляются значения уровней значимости
, соответствующие расчетным значениям
. Они приведены в столбце «Р-значения». Для определения
используется функция:
=СТЬЮДРАСП().
Если выполняется условие
, (5)
то коэффициент считается значимым. Здесь
- заданный уровень значимости (обычно
).
Зная значения можно найти границы доверительных интервалов для коэффициентов регрессии:
;
(6)
.
В программе «Регрессия» приведены в столбце «Нижние 95%»;
- «Верхние 95%».
Если незначимым окажется свободный член , то для пересчета уравнения регрессии без этого коэффициента в диалоговом окне «Регрессия» следует активировать флажок «Константы - ноль». В случае, если незначимым является коэффициент при факторном признаке
, то следует исключить этот признак при задании уравнения регрессии.
Пример 1: получим уравнение множественной регрессии для зависимости функции от двух факторов, т.е.
. Линейное уравнение имеет следующий вид:
.
Воспользуемся данными из таблицы п. 2.1. В этой табл.: - уровень преступности (
);
- уровень образования (
);
- уровень безработицы (
).
Результаты расчетов по программе «Регрессия» приведены на рис. 3.
Рис. 3. Лист Excel с результатами работы программы «Регрессия»
(множественная регрессия)
Видно, что в целом уравнение значимо, но коэффициент при переменной
не значим и его следует исключить из анализа (т.е. при обращении к программе не указывать массив
). Получив уравнение
увидим, что в целом качество этого нового уравнения регрессии повысится (получим большее значение «F» и, следовательно, меньшую величину «Значимость F»).
Пример 2: по данным таблицы получить уравнение . Убедится, что не значим коэффициент
. Исключить его, т.е. получить уравнение вида:
. Выполнить самостоятельно.
Номер предприятия | Прибыль, млн. руб. | Величина оборотных средств, млн. руб. | Стоимость основных фондов, млн. руб. |
![]() | ![]() | ![]() | |