Доверительные интервалы прогноза
Вопрос 4. Доверительные интервалы прогноза. Оценка адекватности и точности моделей
Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t, соответствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя.
На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать «вилку» возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный.
Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано:
1) субъективной ошибочностью выбора вида кривой;
2) погрешностью оценивания параметров кривых;
3) погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.
Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда, и возможность отклонения от этого тренда, определяется в виде:
, (5.26)
где п - длина временного ряда;
L - период упреждения; - точечный прогноз на момент n+L;
ta - значение t-статистики Стьюдента;
Sp - средняя квадратическая ошибка прогноза.
Предположим, что тренд характеризуется прямой:
Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность. Погрешность параметра а0 приводит к вертикальному сдвигу прямой, погрешность параметра а1 изменению угла наклона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций относительно линий тренда, дисперсию S2p можно представить в виде:
, (5.27)
где: Sy2 -дисперсия отклонений фактических наблюдений от расчетных;
tl - время упреждения, для которого делается экстраполяция, tl = n + L;
t - порядковый номер уровней ряда, t=1, 2,..., п;
- порядковый номер уровня, стоящего в середине ряда,
;
Тогда доверительный интервал можно представить в виде:
. (5.28)
Обозначим корень в выражении (5.28) через К. Значение К зависит только от п и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К*= taK . Тогда интервальная оценка будет иметь вид:
. (5.29)
Выражение, аналогичное (5.28), можно получить для полинома второго порядка:
(5.30)
или
. (5.31)
Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:
, (5.32)
где: yt - фактические значения уровней ряда,
-расчетные значения уровней ряда,
п - длина временного ряда,
k - число оцениваемых параметров выравнивающей кривой.
Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома. Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении Sy, так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения.
Рис. 5.4. Доверительные интервалы прогноза для линейного тренда
Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.
По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).
В таблице 5.4 приведены значения К* в зависимости от длины временного ряда п и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (п) значения К* уменьшаются, с ростом периода упреждения L значения К* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений п: чем больше длина ряда, тем меньшее влияние оказывает период упреждения L.
Таблица 5.4
Значения К* для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 (7)
Длина ряда (п) | Линейный тренд | длина ряда (п) | Параболический тренд |
период упреждения (L) 1 2 3 | период упреждения (L) 1 2 3 | ||
2,6380 2,8748 3,1399 | 3,948 5,755 8,152 | ||
2,4631 2,6391 2,8361 | 3,459 4,754 6,461 | ||
2,3422 2,4786 2,6310 | 3,144 4,124 5,408 | ||
2,2524 2,3614 2,4827 | 2,926 3,695 4,698 | ||
2,1827 2,2718 2,3706 | 2,763 3,384 4,189 | ||
2,1274 2,2017 2,2836 | 2,636 3,148 3,808 | ||
2,0837 2,1463 2,2155 | 2,536 2,965 3,516 | ||
2,0462 2,1000 2,1590 | 2,455 2,830 3,286 | ||
2,0153 2,0621 2,1131 | 2,386 2,701 3,100 | ||
1,9883 2,0292 2,0735 | 2,330 2,604 2,950 | ||
1,9654 2,0015 2,0406 | 2,280 2,521 2,823 | ||
1,9455 1,9776 2,0124 | 2,238 2,451 2,717 | ||
1,9280 1,9568 1,9877 | 2,201 2,391 2,627 | ||
1,9117 3,9375 1,9654 | 2,169 2,339 2,549 | ||
1,8975 1,9210 1,9461 | 2,139 2,293 2,481 | ||
1,8854 1,9066 1,9294 | 2,113 2,252 2,422 | ||
1,8738 1,8932 1,9140 | 2,090 2,217 2,371 | ||
1,8631 1,8808 1,8998 | 2,069 2,185 2,325 | ||
1,8538 1,8701 1,8876 | 2,049 2,156 2,284 |