Оценок по моделям регрессии

Доверительные интервалы при получении

Оценка доверительного интервала прогноза в моделях парной регрессии.Рассмотрим построение доверительного интервала прогноза для модели парной регрессии:

. (8.6)

Определим прогнозное значение среднего значения Y, соответствующего некоторому значению Х0. Оценки, полученные методом наименьших квадратов, дадют наилучший несмещенный точечный прогноз Y0 в точке Х0:

. (8.7)

Прогнозное значение, скорее всего, не будет совпадать с фактическим значением Y0, так как для получения прогноза использовалась оцененная траектория регрессии, и кроме того существуют случайные возмущения, относящиеся к периоду прогноза. Таким образом, Y0 представляет собой случайную переменную, вычислим ее дисперсию.

Оценки параметров модели МНК равны:

,

,

где , , .

Используя допущения модели о независимости случайных возмущений, определим дисперсии оценок.

.

Так как , то и окончательно получим:

.

Аналогично

.

Ковариация оценок равна:

.

Используя приведенные выше результаты, определим дисперсию:

. (8.8)

Используем полученный результат, чтобы представить предсказанное значение Y0 в форме доверительного интервала. Так как – линейная функция от величин , имеющих двумерное нормальное распределение, то распределение также удовлетворяет нормальному закону со средним и дисперсией, заданной (8.8). Для получения доверительного интервала используем t-статистику Стьюдента, которая будет иметь t-распределение с n-2 степенями свободы

.

Таким образом, 100(1-e)%-ный доверительный интервал для среднего значения Y, соответствующего данному значению Х0 задается формулой

. (8.9)

Если доверительные интервалы, соответствующие (8.9) нанести на график (рис. 8.1), то они расположатся выше и ниже линии регрессии в виде ветвей гиперболы, ограничивая доверительную область. Погрешность в значении параметра приводит к вертикальному сдвигу линии регрессии, колеблемость параметра , приводит к покачиванию линии регрессии. При одинаковой оценке , линия регрессии будет поворачиваться вокруг оси с координатами . Эта доверительная область определяет местоположение линии регрессии, то есть средних величин Y, но не отдельных возможных значений зависимой переменной, которые отклоняются от средней.

 
 

 

 


 

 

Рис.8.1. Доверительные интервалы линейного уравнения регрессии

 

Определим теперь доверительный интервал не для среднего значения Y, а для некоторого значения Y0, которое мы связываем с Х0: выясним, удовлетворяет ли новая пара наблюдений 0, Y0) прежней линейной структуре (8.6-8.7).

Введем новую переменную z:

, .

Определим дисперсию z, воспользовавшись независимостью u0 от u1,…,un, на основе которых были получены оценки .

,

Переменная z представляет собой линейную комбинацию нормально распределенных переменных, следовательно, сама имеет нормальное распределение. Так как в D(z) входит неизвестное истинное значение , перейдем к величине

,

имеющей t-распределение с n-2 степенями свободы, а 100(1-e)%-ный доверительный интервал для Y0 есть

. (8.10)

 

Оценка доверительного интервала прогноза в моделях линейной множественной регрессии.Рассмотрим более общий случай. Пусть модель имеет вид

, . (8.11)

Определим прогнозное значение Yn+1, в предположении, что в периоде n+1 ожидается следующий вектор-столбец значений X:

. (8.12)

Показано, что наилучшим несмещенным прогнозом для будет , если . Точечный прогноз получается непосредственно:

.

Для того чтобы получить интервальный прогноз, необходимо установить характер выборочного распределения точечного прогноза.

,

, так как .

Дисперсия оценки

. (8.13)

Так как удовлетворяют многомерному нормальному распределению, величина тоже распределена нормально, то есть

.

Сформулируем t-критерий

,

где .

Величина t удовлетворяет t- распределению с n-k степенями свободы, следовательно, 100(1-e)%-ный доверительный интервал для задается формулой:

. (8.14)

Доверительный интервал будет шире, если мы будем рассматривать изолированное значение Y, ассоциируемого с вектором

.

Точечный прогноз есть

.

Реальное значение равно:

,

где - случайная помеха в прогнозируемом периоде.

Разность между прогнозируемой величиной и реальной есть

.

Так как и , то , и, учитывая независимость u, получим

.

Сформулируем t-критерий

.

Величина t удовлетворяет t-распределению с n-k степенями свободы. Следовательно, 100(1-e)%-ный доверительный интервал для Yn+1 определяется как

. (8.15)

При прогнозировании по многофакторной модели необходимо знать прогнозные значения всех входящих в нее факторов. Оценки этих факторов могут быть получены на основе временных экстраполяционных моделей или заданы пользователем. В этом случае можно интерпретировать рассчитанное по регрессии значение Y при некоторых заданных Х как оценку условной вероятности события Y при фиксированных Х. Оценки подставляют в модель и получают точечный прогноз результирующего показателя. Следовательно, точность прогноза будет определяться тем, насколько надежно оценены значения независимых переменных.

Доверительные интервалы прогнозов многофакторных моделей зависят от удаления экзогенных переменных от их среднего значения, стандартных ошибок выборочных оценок параметров модели, объема выборочной совокупности исходных данных. При построении прогноза с использованием систем одновременных уравнений ширина доверительного интервала будет увеличиваться в зависимости от количества уравнений входящих в модель. Точность прогнозного значения каждой эндогенной переменной зависит от точности определения всех других эндогенных переменных систем. Следует также учесть, что и сами значения экзогенных переменных являются прогнозными. Точность прогноза по таким моделям не всегда бывает удовлетворительной, усложнение модели и стремление приблизить ее к реальной системе не всегда дает желаемые результаты. Следует также отметить, что вопрос о том, в какой мере в будущем сохранится найденная тенденция, не может быть решен с помощью доверительных интервалов. Этот вопрос решается с помощью экономического анализа и экспертной оценки.

В рассмотренном подходе построение доверительных интервалов линейных моделей основано на использовании ошибок параметров. Аналитически данная проблема решена для линейных моделей. В случае нелинейной модели, приводимой к линейному виду, также возможно интервальное оценивание доверительных интервалов.

Оценка доверительного интервала прогноза в моделях нелинейной регрессии.Рассмотрим построение доверительных интервалов прогноза для показательной функции . Данная функция после логарифмирования приводится к линейному виду:

.

Для преобразованной функции можно найти среднеквадратические ошибки оценок параметров и и среднеквадратическую ошибку прогноза для :

,

где - среднеквадратическое отклонение в логарифмах.

С помощью обратного преобразования определяются доверительные интервалы прогноза для исходной модели:

 

.

Степенная модель логарифмированием также приводится к линейному виду:

.

Доверительный интервал прогноза строится для линейной модели с учетом того, что при определении стандартной ошибки параметра b используются не исходные данные, а преобразованные (логарифмы):

,

где - среднеквадратическое отклонение в логарифмах.

С помощью обратного преобразования определяются доверительные интервалы прогноза для исходной модели:

.

Доверительные интервалы, определяемые для функций приводимых к линейному виду с помощью логарифмического преобразования, являются несимметричными относительно точечного прогноза.