Парная линейная регрессия. Метод наименьших квадратов
Пусть установлено наличие статистически значимой зависимости между физическими величинами и
. Тогда эту зависимость можно аппроксимировать эмпирической формулой. Термин «аппроксимировать» имеет смысл «приближенно описать». Термины – «эмпирическая формула», «аппроксимирующая формула», «уравнение регрессии» имеют примерно одинаковое значение. Эмпирическая формула – это формула, полученная путем описания эмпирических (экспериментальных) данных.
Результаты экспериментов представляют в виде таблицы:
Независимая переменная (фактор) ![]() | ![]() | ![]() | ![]() | … | ![]() | … | ![]() |
Экспериментальные значения функции отклика ![]() | ![]() | ![]() | ![]() | … | ![]() | … | ![]() |
Здесь - объем выборки (число опытов),
; например,
- продолжительность жизни человека (годы);
- количество выкуриваемых в день сигарет (штук). Другой пример:
- предел прочности металла
(МПа);
- температура нагрева металла (
).
Выбор вида формулы для описания зависимости начинают с нанесения опытных значений
и
на график. Формула может быть линейной, квадратичной, степенной. Вид формулы подбирают по общему расположению опытных точек на графике. Пусть точки группируются около прямой линии. Тогда зависимость
можно аппроксимировать линейным уравнением регрессии:
, (1)
где - расчетные (по уравнению (1)) значения,
и
- коэффициенты регрессии. Новое обозначение «
» указывает, что формула (1) отображает с некоторой вероятностью экспериментальную зависимость
(
- исходные экспериментальные значения). Формула (1) является уравнением парной регрессии, так как
зависит от одного фактора
, т.е. рассматривается пара
-
.
Коэффициенты и
неизвестны и определяются по
парам экспериментальных значений
с помощью метода наименьших квадратов (МНК).
Суть МНК: коэффициенты регрессии и
определяют из условия, что
сумма квадратов отклонений ()
опытных значений
от рассчитанных по
формуле (1) должна быть минимальной:
, (2)
где - остатки (отклонения; см. рис. 1). Здесь и далее
Рис. 1. Графическая иллюстрация МНК
Для вычисления и
, минимизирующих
, необходимо вычислить частные производные функции
по аргументам
и
и приравнять их нулю:
;
. (3)
Подставим в (3) из выражения (2) и вычислим производную по правилу дифференцируемой сложной функции:
(4)
Преобразуем (4):
(5)
Систему (5) принято называть системой нормальных уравнений. Решаем линейные системы уравнений (5) относительно неизвестных и
методом определителей (метод Крамера):
;
,
где ,
,
- определители;
;
Пример. Имеются экспериментальные данные.
№ п/п | ![]() | ||||||||
![]() | |||||||||
![]() |
;
;
;
;
;
;
;
;
.
.
Например: .