Множественная регрессия

Предположим, что имеется несколько факторных признаков Х1, Х2, …, Хk, k > 1, и один результативный признак Y. Модель множественной регрессии будет иметь вид:

,

х =(х1, х2,…, хk) – вектор значений факторных признаков;

у*х = f(х1, х2,…, хk, a), где функция f(x, a) выбирается из задаваемого параметрического семейства функций.

Для нахождения параметров функции f(x, a) используется МНК.

Относительно eх предполагается выполнение условий, сформулированных для случая простой двумерной регрессии.

Введем обозначения:

– матрица наблюдений. , , .

Тогда регрессионную модель представим в матричном виде Y = XA + e.

Для нахождения ai будем использовать метод наименьших квадратов:

.

 

ХТХА = ХТY, det ХТХ ¹ 0,

 

А = (ХТХ)-1ХТY.

 

 

, i ¹ j; ; .

Добавим равенство .

Запишем данную систему для случая, когда имеется два факторных признака, т.е. k = 2.

Откуда

, .

Обозначим . Величины bi называют стандартизированными коэффициентами множественной регрессии. Получим

Матрицу, составленную из коэффициентов

называют корреляционной (или матрицей парных коэффициентов корреляции).

Для проверки адекватности модели применяют множественный коэффициент детерминации , где ryмножественный коэффициент корреляции, , , – сумма квадратов отклонений теоретических и средних значений;

=.

Слагаемые в правой части последнего равенства называют коэффициентами раздельной детерминации.

 

Заметим, что определитель = 0.

Обозначим

Dk = , Dk+1 =

Тогда

0 = = + = Dk+1 + r2y Dk.

 

Следовательно,

r2y = – Dk+1 /Dk.

Величину называют системным эффектом.

Частные коэффициенты детерминации:

, ,

где – коэффициент детерминации для уравнения регрессии со всеми факторными признаками, кроме xm.

Для определения корреляционной зависимости между признаками, которые заданы в порядковой шкале, используется множественный коэффициент ранговой корреляции, иначе коэффициент конкордации:

,

где k – число признаков х1,…,хk, n – число наблюдений;

,

– ранги соответствующих значений.

Наблюдение записывается в виде вектора ().

Раздел III. Статистическое изучение динамики

 

Определение. Временным рядом (ВР) или рядом динамики (РД) называют последовательность упорядоченных во времени измерений некоторого количественного признака, описывающего изучаемое явление.

Отдельные значения временного ряда yt, , называют уровнями ряда. Уровни могут относиться к определенным моментам времени либо к определенным интервалам времени. В зависимости от этого различают моментные и интервальные временные ряды.

При изучении временного ряда требуется, чтобы его уровни были сопоставимы. Это условие должно учитываться в период сбора данных. В противном случае, потом потребуется произвести перерасчет данных.