Проверка значимости (адекватности) уравнения регрессии в целом
После расчета коэффициентов регрессии необходимо оценить статистическую значимость (адекватность) полученного уравнения регрессии. Т.е. количественно оценить качество описания уравнением опытных данных. В программе «Регрессия» (см. рис. 2) коэффициенты находятся в столбце «Коэффициенты» (- строка «У-пересечение», - Строка «Переменная Х1» и т.д.).
Сначала рассчитаем суммы квадратов отклонения :
а) - сумма квадратов отклонений эмпирических данных от среднего:
. (1)
характеризует общую изменчивость , т.е. влияние как основных, так и остаточных факторов. Основные факторы – переменные , входящие в уравнение регрессии.
б) - сумма квадратов отклонений расчетных данных (по уравнению регрессии) от среднего:
. (2)
Данная величина характеризует факторную изменчивость, т.е. влияние на основных факторов .
в) - сумма квадратов отклонений эмпирических данных от расчетных:
. (3)
Данная величина характеризует остаточную изменчивость, отражающую влияние остаточных факторов на .
Причем
;
(4)
.
В программе «Регрессия» в таблице «Дисперсионный анализ» суммы квадратов размещены в строках:
«» - заголовок столбца;
«Регрессия» → (факторная изменчивость);
«Остаток» → (остаточная изменчивость);
«Итого» → (общая изменчивость).
С указанными выше суммами квадратов (или изменчивостями) связаны следующие степени свободы:
для → степень свободы (число факторов );
для → степень свободы ;
для → степень свободы .
Причем
;
(5)
.
В программе «Регрессия» степени свободы записаны в столбце «» и строках: «Регрессия» → ; «Остаток» → ; «Итого» → .
Отношение факторной изменчивости к общей называется коэффициентом детерминации:
. (6)
В программе «Регрессия» записан в строке «-квадрат» (таблица «Регрессионная статистика»).
Если , то функция отклика не зависит от факторов . Если , то изменчивость обусловлена влиянием только факторов .Все экспериментальные точки лежат на одной линии.
При вероятностной (стохастической связи) . При значениях
Рис. 2. Лист Excel с результатами работы программы «Регрессия»
(парная регрессия)
считается, что вариация функции отклика обусловлена в основном влиянием включенных в регрессионную модель факторов .
Коэффициент множественной корреляции . При зависимости от одного фактора . В программе - «Множественный ».
В большинстве случаев уравнение регрессии строят на основе выборочных данных. Поэтому необходимо оценить адекватность полученного уравнения генеральным данным. Для этого проводится проверка статистической значимости коэффициента детерминации по критерию Фишера:
, (7)
где - расчетное значение критерия Фишера;
- факторная дисперсия;
- остаточная дисперсия;
; (8)
. (9)
В программе «Регрессия» в таблице «Дисперсионный анализ» дисперсии находятся в столбце «» в строках:
→ «Регрессия»;
→ «Остаток»;
расчетное значение коэффициента Фишера – в столбце «».
Коэффициент детерминации считается значимым при выполнении условия:
(10)
где - табличное значение коэффициента Фишера; его можно определить с использованием стандартной функции FРАСПОБР.
В программе «Регрессия» вместо проверки условия (10) заложен другой подход. В столбце «Значимость » приводится значение уровня значимости, соответствующее вычисленному значению . Обозначим его . Значение в программе определяется с использованием функции
.
Если выполняется условие
, (11)
то и в целом уравнение регрессии считается значимым. Здесь - заданный уровень значимости; обычно .
В программе в таблице «Регрессионная статистика» приводится значение «Стандартная ошибка». Это среднеквадратичное отклонение:
(12)
Чем меньше , тем лучше уравнение регрессии описывает опытные данные.