Линейнаямодель парной корреляции.

Лекция 2. 08.02.13.

 

Регрессионный анализ заключается в определении аналитического выражения связи, которая при изменении одной величины (результативного признака У) обусловлено влиянием независимой величины (факторного признака - Х).

Количественно оценить данную взаимосвязь можно с помощью построения уравнения регрессии или регрессионной функции.

Предположим, что графическое изображение исходных данных на координатной плоскости позволило выдвинуть рабочую гипотезу, что корреляционная связь между факторами Х и У может быть описана линейной зависимостью. Базисной регрессионной моделью является модель парной (однофакторной регрессии).

Общий вид парного уравнения регрессии

 

- независимая - зависимая

и- параметры уравнения регрессии подлежащие оцениванию

– случайная ошибка модели регрессии

 

Появления случайной ошибки может быть обусловлено следующими факторами:

1) в модель парной регрессии включается 1 фактор, который не способен полностью объяснить вариацию результативного признака, этот фактор в свою очередь не способен объяснить, этот фактор может быть подвержен влиянию множества других факторов гораздо большей степени

2) ошибка может быть объяснена вероятностью того, что переменные, участвующие в модели, могут быть измерены с ошибкой.

Параметр уравнения регрессии называется коэффициентом регрессии, его величина показывает насколько в среднем изменится результативный признак У, при изменении факторного признака Х на единицу.

Знак параметра уравнения парной регрессии указывает на направление связи.

Если больше 0, то связь между изучаемыми показателями прямая, т.е. с увеличением факторного признака Х увеличивается и результативный признак У и наоборот.

Если меньше 0, то связь между изучаемыми показателями обратная, т.е. с увеличением Х результат уменьшается.

Значение параметра уравнении парной регрессии трактуется как среднее значение результативного признака У, при условии, что факторный признак Х равен 0.

 

Оценкапараметровиуравнения регрессии осуществляется методом наименьших квадратов(МНК). Согласно методу МНК минимизируются суммы квадратов отклонений фактических значений результативного признака от теоритических значений соответствующих выбранному уравнению регрессии.

Необходимым условием экстремума этой функций является равенство 0 всех частных производных 1 порядка от этой функции по параметрам и .

Вставка.

 

Что бы избавится от. Первое уравнение умножим на сумму , а второе на n. Из 2 уравнения вычтем 1. Тогда мы избавимся от.

 

Что бы перейти к средним значениям числитель и знаменатель полученной дроби. Разделим на n в квадрате.

 

Для того что бы найти формулу для левая и правая часть 1 уравнения разделим на n.

 

Ошибки вычислений.

Ошибка теоритической модели

Это ошибка не должна превышать 3%. В таком случае модель удовлетворительна.

Оценка точности аппроксимации данных линейным уравнением оценивается по следующей формуле.

Считается что модель удовлетворительно оценивает если ошибка меньше 12%.