Множественная регрессия

Предположим, что имеется несколько факторных признаков Х₁, Х₂, …, Х_k, k > 1, и один результативный признак Y. Модель множественной регрессии будет иметь вид:

х =(х₁, х₂,…, х_k) – вектор значений факторных признаков;

у*_х = f(х₁, х₂,…, х_k, a), где функция f(x, a) выбирается из задаваемого параметрического семейства функций.

Для нахождения параметров функции f(x, a) используется МНК.

Относительно e_х предполагается выполнение условий, сформулированных для случая простой двумерной регрессии.

Введем обозначения:

– матрица наблюдений. , , .

Тогда регрессионную модель представим в матричном виде Y = XA + e.

Для нахождения a_i будем использовать метод наименьших квадратов:

Х^ТХА = Х^ТY, det Х^ТХ ¹ 0,

А = (Х^ТХ)^-1Х^ТY.

, i ¹ j; ; .

Добавим равенство .

Запишем данную систему для случая, когда имеется два факторных признака, т.е. k = 2.

Откуда

, .

Обозначим . Величины b_i называют стандартизированными коэффициентами множественной регрессии. Получим

Матрицу, составленную из коэффициентов

называют корреляционной (или матрицей парных коэффициентов корреляции).

Для проверки адекватности модели применяют множественный коэффициент детерминации , где r_y – множественный коэффициент корреляции, , , – сумма квадратов отклонений теоретических и средних значений;

Слагаемые в правой части последнего равенства называют коэффициентами раздельной детерминации.

Заметим, что определитель = 0.

Обозначим

D_k = , D_k₊₁ =

Тогда

0 = = + = D_k₊₁ + r²_y D_k.

Следовательно,

r²_y = – D_k₊₁ /D_k.

Величину называют системным эффектом.

Частные коэффициенты детерминации:

, ,

где – коэффициент детерминации для уравнения регрессии со всеми факторными признаками, кроме x_m.

Для определения корреляционной зависимости между признаками, которые заданы в порядковой шкале, используется множественный коэффициент ранговой корреляции, иначе коэффициент конкордации:

где k – число признаков х₁,…,х_k,n – число наблюдений;

– ранги соответствующих значений.

Наблюдение записывается в виде вектора ().

Раздел III. Статистическое изучение динамики

Определение. Временным рядом (ВР) или рядом динамики (РД) называют последовательность упорядоченных во времени измерений некоторого количественного признака, описывающего изучаемое явление.

Отдельные значения временного ряда y_t, , называют уровнями ряда. Уровни могут относиться к определенным моментам времени либо к определенным интервалам времени. В зависимости от этого различают моментные и интервальные временные ряды.

При изучении временного ряда требуется, чтобы его уровни были сопоставимы. Это условие должно учитываться в период сбора данных. В противном случае, потом потребуется произвести перерасчет данных.

5rik.ru

Материалы для учебы и работы

Множественная регрессия