Лекция 22.03.13

Сформировать многофакторную модель – пороговые значения взять те же, что и раньше. Двухфакторную модель посчитать вручную. N≥30.

ТЕОРИТИЧЕСКИЕ ПРЕДПОСЫЛКИ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ.

 

Параметры модели управления регрессии рассчитываются по данным наблюдений по методу наименьших квадратов.

Случайная составляющая е – это не наблюдаемая величина оценки которой можно получить только после оценки параметров модели как разности фактических и теоритических значений результативного признака.

Поскольку они не являются реальными случайными остатками то их можно считать ё некоторой выборочной реализации и неизвестного остатка заданного уравнения.

При добавлении в модель новых наблюдений выборочные оценки остатка еи могут меняться поэтому, в задачу регрессионного анализа входит не только построение самой модели, но и исследование остаточных величин еи.

Для получения достоверных результатов по уравнению регрессии оценки ютых коэффициентов (Би) должны быть:

1) не смещенными

2) состоятельными

3) эффективными

Несмещенность оценки БИ означает, что математическое ожидание остатков должно быть равно 0. M(ei)=0. Остатки носят случайный характер и средние величины должны стремится к 0. Следовательно при большом числе выборочных оцениваний остатки не будут накапливаться и найденные параметры регрессии БИ можно рассматривать как среднее значение из большого количества несмещенных оценок. Если оценки Би обладают параметром несмещенности то их можно сравнивать с разными исследованиями. Для проверки случайного параметра остатков строится график зависимости остатков еи от теоритических значений результативного признака.

Вставить график.

Если на графике получается горизонтальная полоса, то остатки еи представляют собой случайные величины, что соответствует требованиям методам наименьших квадратов.

Однако могут быть следующие случаи расположения остатков.

Остатки носят систематический характер (зависят от уи)

Вставки

Последний случай(треугольник) характеризуется тем, что остатки не имеют случайной дисперсии.

В этих случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию (увеличить число элементов выборки), либо поменять факторы входящие в модель, пока остатки не будут случайными величинами.

Несмещенность оценок БИ регрессии, полученных с помощью методов наименьших квадратов зависит от независимости случайных остатков еи и факторов хи.

Для проверки строится график зависимости случайных остатков еи от факторов включенных в регрессию. Если остатки расположены в виде горизонтальной полосы то они независимы от значения фактора хжи. Если же мы увидим на графике наличие зависимости еи от какого-либо фактора то модель не адекватна относительно этого фактора.

Причинами неадекватности модели может быть:

1) неправильная спецификация модели и в неё необходимо включить дополнительные переменные;

2) скопление тучек в определенных участках значений фактора говорит о систематической погрешности модели.

Состоятельность оценок – характеризуется увеличением их точности с увеличением объёма выборки.

Проверка соблюдений предпосылок МНК включает исследование этих остатков на то, что:

1. Остатки носят случайный характер;

2. Средняя величина остатка равна 0;

3. Автокорреляция остатков отсутствует.

Те возмущения еи ежитое являются независимыми друг от друга те результаты полученные в итом наблюдении не связаны с предыдущими наблюдениями не содержат информации о последующих наблюдениях и не влияют на них те автокорреляция отсутствует.

Для опреления наличия автокорреляции используется критерий ДВ. Если автокорреляция в отклонении была обнаружена, то от нее необходимо избавиться.

Основными методами корректировки автокорреляции являются:

1) тк автокорреляция чаще всего вызывается спецификацией модели, то необходимо скорректировать саму модель, те

2) если эти действия не позволили решить проблему автокорреляции то следует применить авторегрессионную схему, которая заключается в следующем. Предполагается что случайное отклонение подвержено автокорреляции 1 порядка в этом случае еи можно представить следующим образом.

ra – коэффициент автокорреляции

vi – представляет собой так называемый белый шум, те последовательность независимых случайных величин с 0 средней и постоянной дисперсией.

В этом случае исходное уравнение регрессии приводится к следующему виду

3) оценки считаются эффективными, если они характеризуются наименьшей дисперсией , что бы сигма2 =>мин, кроме того дисперсия остатком должна обладать свойством гомоскедастичности – это значит что для каждого значения фактора хи остатки еи имеют одинаковую дисперсию те сигма2 = конст. Иначе невозможно использовать формулы которые мы выводили для коэффициентов регрессии, эти формулы предполагают для любых факт хи. Явления когда условия гомоскедастичности нарушаются называется гетероскедостичностью те сигмаи2 не равно сигма жи2. Для обнаружения гетероскедостичности наиболее эффективным методом являются использования теста ранковой корреляции Спирмена. Этот тест заключается в проверке коррелированности абсолютных значений остатков модуль еи и значений хи, те проверяется не просто зависимости между ними а её приближение к линейной зависимости. В тестах для обнаружения гетероскедостичности делаются различные предположения о зависимости между дисперсии случайного чтлена еи и величины случайной переменной хи. Выдвигается нулевая гипотеза Н0. Н0 = гетероскедостичность отсутствует. Далее для заданных значений хи и соответствующих осттаков те модулей еи определяются ранки и расчитывается коээфициент фспирмена

Где n – число наблюдений

D – разность ранков хи и еи

Tвыб =

T кр = t(a/2; n-k) стьюдраспор

Если ткрит > т выб то Н0 гипотеза не отвергается гетероскед отсутвует

Если то Н0 отвергается ро ≠0 гетероскудостчность присутствует.

Пример, Оценивая регрессионную зависимость выпуска продукции обрабатывающей промышленности от ВВП х

По исходным данным с помощью метода НМК