Проверка значимости (адекватности) уравнения регрессии в целом

После расчета коэффициентов регрессии необходимо оценить статистическую значимость (адекватность) полученного уравнения регрессии. Т.е. количественно оценить качество описания уравнением опытных данных. В программе «Регрессия» (см. рис. 2) коэффициенты находятся в столбце «Коэффициенты» (- строка «У-пересечение», - Строка «Переменная Х1» и т.д.).

Сначала рассчитаем суммы квадратов отклонения :

а) - сумма квадратов отклонений эмпирических данных от среднего:

. (1)

характеризует общую изменчивость , т.е. влияние как основных, так и остаточных факторов. Основные факторы – переменные , входящие в уравнение регрессии.

б) - сумма квадратов отклонений расчетных данных (по уравнению регрессии) от среднего:

. (2)

Данная величина характеризует факторную изменчивость, т.е. влияние на основных факторов .

в) - сумма квадратов отклонений эмпирических данных от расчетных:

. (3)

Данная величина характеризует остаточную изменчивость, отражающую влияние остаточных факторов на .

Причем

;

(4)

.

В программе «Регрессия» в таблице «Дисперсионный анализ» суммы квадратов размещены в строках:

«» - заголовок столбца;

«Регрессия» → (факторная изменчивость);

«Остаток» → (остаточная изменчивость);

«Итого» → (общая изменчивость).

С указанными выше суммами квадратов (или изменчивостями) связаны следующие степени свободы:

для → степень свободы (число факторов );

для → степень свободы ;

для → степень свободы .

Причем

;

(5)

.

 

В программе «Регрессия» степени свободы записаны в столбце «» и строках: «Регрессия» → ; «Остаток» → ; «Итого» → .

Отношение факторной изменчивости к общей называется коэффициентом детерминации:

. (6)

В программе «Регрессия» записан в строке «-квадрат» (таблица «Регрессионная статистика»).

Если , то функция отклика не зависит от факторов . Если , то изменчивость обусловлена влиянием только факторов .Все экспериментальные точки лежат на одной линии.

При вероятностной (стохастической связи) . При значениях

 

Рис. 2. Лист Excel с результатами работы программы «Регрессия»

(парная регрессия)

 

считается, что вариация функции отклика обусловлена в основном влиянием включенных в регрессионную модель факторов .

Коэффициент множественной корреляции . При зависимости от одного фактора . В программе - «Множественный ».

В большинстве случаев уравнение регрессии строят на основе выборочных данных. Поэтому необходимо оценить адекватность полученного уравнения генеральным данным. Для этого проводится проверка статистической значимости коэффициента детерминации по критерию Фишера:

, (7)

где - расчетное значение критерия Фишера;

- факторная дисперсия;

- остаточная дисперсия;

; (8)

. (9)

В программе «Регрессия» в таблице «Дисперсионный анализ» дисперсии находятся в столбце «» в строках:

→ «Регрессия»;

→ «Остаток»;

расчетное значение коэффициента Фишера – в столбце «».

Коэффициент детерминации считается значимым при выполнении условия:

(10)

где - табличное значение коэффициента Фишера; его можно определить с использованием стандартной функции FРАСПОБР.

В программе «Регрессия» вместо проверки условия (10) заложен другой подход. В столбце «Значимость » приводится значение уровня значимости, соответствующее вычисленному значению . Обозначим его . Значение в программе определяется с использованием функции

.

Если выполняется условие

, (11)

то и в целом уравнение регрессии считается значимым. Здесь - заданный уровень значимости; обычно .

В программе в таблице «Регрессионная статистика» приводится значение «Стандартная ошибка». Это среднеквадратичное отклонение:

(12)

Чем меньше , тем лучше уравнение регрессии описывает опытные данные.