Доверительный интервал для тренда в общем виде определяется как
, (8.17)
где - значение t-статистики Стьюдента;
- средняя квадратическая ошибка тренда.
Для учета неопределенности, связанной не только с положением тренда, но и с возможностью отклонения от этого тренда, вводится средняя квадратическая ошибка прогноза . Тогда доверительный интервал прогноза будет равен:
, (8.18)
где L - период упреждения.
Основная трудность при определении доверительного интервала прогноза состоит в том, что не для всех классов моделей имеются аналитические выражения оценки границ доверительного интервала. Также все аналитические выражения для определения доверительных интервалов исходят из предположения о нормальном распределении ошибок аппроксимации, что не всегда выполняется.
Рассмотрим построение доверительных интервалов для разных типов кривых. Отметим, что аналитическое выражение доверительного интервала удалось получить не во всех случаях. В частности, доверительные интервалы для сложных кривых, отличающихся от полиномов, имеют достаточно условный характер. Для определения доверительных интервалов полиномов необходимо получить среднеквадратическую ошибку прогноза. Будем исходить из того, что ошибки прогноза связаны только с ошибками в оценках параметров.
Покажем определение доверительных интервалов прогноза для трендов, описываемых соответственно прямой, квадратической и кубической параболами. Для получения среднеквадратических ошибок прогноза полиномов удобно воспользоваться матричным выражением дисперсии множественной регрессии (формула 8.13). Заменив переменные Х на характеристики времени t, получим:
, (8.19)
где - оценка дисперсии ,
- для прямой,
- для квадратичной параболы,
- для кубической параболы,
- время, для которого производится экстраполяция.
Матрицы нормальных уравнений для этих кривых при условии, что начало отсчета времени приходится на середину ряда, имеют следующий вид:
,
,
.
После ряда преобразований получим для прямой:
;
для параболы второй степени:
;
для параболы третьей степени:
.
Для того чтобы учесть рассеяние вокруг кривых в суммарную дисперсию включим дисперсию случайной компоненты e, то есть . Таким образом, получили формулу для расчета средней квадратической ошибки прогноза:
. (8.20)
Для прямой, параболы второго и третьего порядка формулы для расчета средней квадратической ошибки прогноза имеют вид:
,
,
.
Среднеквадратическая ошибка прогноза оказывает преобладающее влияние на ширину доверительного интервала. При одной и той же величине доверительный интервал прогноза тем шире, чем выше степень полинома, характеризующего тренд. Также ширина доверительного интервала для кривых зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.
Уравнения экспоненты и логарифмической параболы с помощью логарифмирования легко приводятся соответственно к линейному и параболическому виду:
,
.
Для приведенных выражений можно найти среднеквадратические ошибки оценок параметров и среднеквадратическую ошибку прогноза. Доверительный интервал определяется выражением:
. (8.21)
Такой же подход возможен при экстраполяции модифицированной экспоненты и S-образных кривых, в случае, если значение асимптоты задано. Тогда модифицированную экспоненту можно записать как
.
Откуда
.
Параметры loga и logb оцениваются обычным методом наименьших квадратов. Располагая значениями границ доверительного интервала для , легко определяются доверительные интервалы прогноза для :
.
Доверительные интервалы, полученные с помощью логарифмического преобразования исходной модели, являются несимметричными относительно величины, определенной по уравнению тренда (точечного прогноза).
Оценка доверительных интервалов в адаптивных моделях.При прогнозировании с использованием адаптивных методов модель используется в двух значениях: как модель временного ряда, выражающая закон генерирования уровней ряда, и как прогнозная модель или предиктор. Отличие этих двух типов моделей в том, что на выходе модели временного ряда оценки фактических уровней ряда, а на выходе прогнозной модели – оценки будущих уровней ряда. Прогнозная модель формируется на последнем шаге вычислений по последним значениям коэффициентов.
Прогнозная модель Хольта-Уинтерса аддитивного типа имеет вид:
, (8.22)
где t - период упреждения, а - прогнозное значение уровня ряда в момент времени n на t - шагов вперед, - аддитивный коэффициент сезонности, наиболее поздняя оценка коэффициента для аналогичного периода года.
Прогнозная модель Хольта-Уинтерса мультипликативного типа имеет вид:
, (8.23)
где t - период упреждения, а - прогнозное значение уровня ряда в момент времени n на t - шагов вперед, - мультипликативный коэффициент сезонности, наиболее поздняя оценка коэффициента для аналогичного периода года.
Каждая сезонная компонента характеризует изменение уровня временного ряда для какого-либо одного периода. Сезонные колебания обычно изменяются не только из года в год, но у них может наблюдаться значительная колеблемость коэффициентов сезонности в различные периоды года. Например, в летние месяцы будет наблюдаться большая вариация коэффициентов сезонности, а в зимние месяцы небольшая. Отсюда следует, что при интервальном оценивании необходимо учесть дисперсию сезонной компоненты именно того периода, на момент которого дается прогноз.
Для подтверждения того, что различие дисперсий сезонных компонент значимо и не может быть объяснено случайными причинами, можно воспользоваться критерием Фишера-Снедекора или критерием Бартлетта.
В случае выборок одинакового размера по критерию Фишера-Снедекора сравнивают наибольшую и наименьшую дисперсию:
и по таблице критических точек распределения Фишера-Снедекора, по заданному уровню значимости и числам степеней свободы находится критическая точка . Если , то различие между сравниваемыми дисперсиями незначимо.
Если окажется, что различие между сравниваемыми дисперсиями незначимо, то подавно незначимо и различие между остальными дисперсиями. Недостаток этого метода в том, что информация, которую содержат остальные дисперсии, кроме наибольшей и наименьшей, не учитывается.
Данного недостатка лишен критерий Бартлетта, критерий проверки однородности двух и большего числа дисперсий. Данный критерий заключается в сравнении логарифма средней дисперсии с суммой логарифмов отдельных дисперсий.
Бартлетт показал, что величина
,
где
,
,
примерно подчиняется c2 –распределению с n-1 степенями свободы. Если вычисленное c2 значение превышает значение c1-a2 для n-1 степени свободы, то гипотеза отвергается.
Для частного случая, когда все равны, так что :
,
где .
Для проверки значимости отличия дисперсий сезонных компонент был рассмотрен типичный представитель тренд-сезонного временного ряда «Денежная масса М0» за интервал времени 1996-2001 годы (рис. 8.2,8.3).
Рис. 8.2. Наличные деньги (М0) за период 1996-2001 гг.
Рис.8.3. График, построенный методом наложения.
Наличные деньги (М0) за период 1996-2001 гг.
В формировании уровней этого ряда существенную роль играют сезонные факторы. После выравнивания тренда с помощью 13-членной центрированной скользящей средней, было выделена сезонная компонента аддитивного и мультипликативного типа.
Наблюдаемое значение Фишера-Снедекора составило 70,67 и 101,41 для дисперсий сезонных компонент аддитивного и мультипликативного типа соответственно, критическое значение составило 4,107 для уровня значимости 0,1. Наблюдаемое значение критерия Бартлетта – 18,74 и 36,03 для дисперсий сезонных компонент аддитивного и мультипликативного типа соответственно, критическое значение составило 17,275 для уровня значимости 0,1.
Итак, исследование показало, что дисперсии сезонных компонент для отдельных месяцев значимо отличаются друг от друга, следовательно, при построении интервального прогноза правомочно учесть дисперсию сезонной компоненты именно того периода, на момент которого дается прогноз.
Важное значение при интервальном оценивании имеет зависимость компонент. Степень тесноты линейной связи между двумя переменными определяется коэффициентом парной корреляции. Чем выше значение коэффициента корреляции, тем теснее связь. Для определения существенности коэффициентов корреляции, их необходимо проверить на значимость по t-критерию Стьюдента. Наблюдаемое значение t-критерия вычисляется по формуле:
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы k находят критическую точку . Если , то коэффициент корреляции значимо отличается от нуля и переменные коррелированы. Коэффициенты корреляции между трендовой составляющей и сезонной составляющей как аддитивного, так и мультипликативного характера, незначимо отличаются от нуля, следовательно, данные компоненты независимы.
Проверив предположения о различии дисперсий сезонных компонент и независимости трендовой и сезонной составляющих временного ряда, рассмотрим построение доверительного интервала для моделей Хольта-Уинтерса. Используя свойство независимости компонент тренд-сезонного временного ряда, дисперсию прогноза для аддитивной модели Хольта-Уинтерса получаем как сумму дисперсии тренда и сезонной компоненты. Дисперсия сезонной компоненты определяется по следующему соотношению:
,
где - дисперсия сезонной компоненты для j - месяца (квартала), – объем выборки сезонных коэффициентов за j - месяц (квартал).
Таким образом, дисперсия прогноза для аддитивной модели Хольта-Уинтерса определяется как:
,
где - оценка дисперсии сезонной компоненты.
Совокупность вычисленных сезонных коэффициентов, как правило, небольшая, она в 4 или в 12 раз меньше общей выборки. Значения среднего и дисперсии, полученные для выборки небольшого размера, могут существенно отличаться от точных (неизвестных) значений. Отклонения выборочных значений от точных сами являются случайными величинами, распределенными по каким-то законам. Очевидно, что вероятность больших отклонений невелика и стремится к нулю при увеличении размеров выборки. Стьюдентом была разработана теория распределения отклонений выборочных значений от точных в зависимости от размеров выборки. В теории вероятностей показано, что усреднение функции распределения по всем возможным значениям этих отклонений с учетом законов распределений выборочного среднего и выборочной дисперсии приводит к расширению плотности распределения - дисперсия увеличивается в раз, где k – размер выборки. С учетом последних обстоятельств, дисперсию сезонных коэффициентов следует скорректировать на размер выборки. Окончательно формула оценки доверительного интервала для аддитивной модели Хольта-Уинтерса примет вид:
. (8.24)
Для определения доверительного интервала для мультипликативной модели Хольта-Уинтерса, логарифмированием приводим ее к модели аддитивного вида:
.
Далее определяются доверительные интервалы для аддитивной модели, полученной с помощью логарифмического преобразования, а затем потенцированием, производится обратный переход – расчет доверительного интервала исходной модели по следующему выражению:
, (8.25)
где , - дисперсии тренда и сезонной компоненты в логарифмах.
Оценка доверительных интервалов в многофакторных моделях.При прогнозировании экономических процессов часто бывает удобно расчленить временной ряд на составляющие (компоненты). В этом случае становится более очевидным воздействие каждого фактора на формирование результирующего признака. Прогноз результирующего признака в таком случае получается объединением (в виде сумм или произведения) прогнозов отдельных компонент.
Для построения интервального прогноза сумм или произведений показателей нужно иметь представление о наличии или отсутствии зависимостей слагаемых или сомножителей. Предположение о зависимости показателей может быть вынесено из содержательного анализа показателей или получено из корреляционно-регрессионного анализа данных.
При прогнозировании по аддитивной модели необходимо рассмотреть два варианта: когда слагаемые независимые величины и когда они зависимы друг от друга. Рассмотрим первый случай. Воспользуемся теоремой математической статистики, согласно которой дисперсия суммы независимых величин равна сумме дисперсий слагаемых.
,
Тогда при условии независимости переменных, входящих в аддитивную модель, имеем:
, (8.26)
где - дисперсия прогноза j-составляющей, N – число суммируемых прогнозов.
Во втором случае, в случае зависимости слагаемых, по теореме математической статистики дисперсия суммы нескольких случайных величин равна сумме всех возможных корреляционных моментов, то есть необходимо определение коэффициентов корреляции между попарно взятыми слагаемыми.
Для двух слагаемых имеем:
.
Дисперсия суммы увеличивается, следовательно, увеличивается и интервал прогнозирования.
Для определения доверительного интервала для мультипликативной модели можно применить переход к аддитивной модели логарифмированием. Затем строятся доверительные интервалы в логарифмах для аддитивной модели, и потенцируя полученные результаты переходим к доверительным интервалам исходной модели.
Используя предложенный выше подход, рассмотрим построение доверительных интервалов для обобщенной аддитивной модели, представляющей тренд-сезонный временной ряд:
, , (8.27)
где - тренд (регулярная компонента);
- сезонная компонента;
- случайная компонента.
При прогнозировании по аддитивной модели отдельно рассчитываются прогнозные значения каждой компоненты временного ряда (тренда и сезонной компоненты) с последующим их суммированием. Наиболее часто на практике тренд аппроксимируют полиномом, а периодическую - функцию отрезком ряда Фурье по наиболее значимым гармоникам. В таком случае обобщенную аддитивную модель можно записать в виде:
, (8.28)
где р – порядок полинома, k – количество гармоник, - частота. Все элементы в модели являются функциями от времени. Если через
обозначить набор факторов, влияющих на зависимую переменную Y, то данную модель можно рассматривать как многофакторную. Параметры модели определяются по методу наименьших квадратов по формуле:
.
Доверительные интервалы для прогнозного значения Yt+1 оцениваются по формуле:
, (8.29)
где - ожидаемый вектор-столбец в периоде .
Мультипликативная модель, представляющей тренд-сезонный временной ряд, имеет вид:
, (8.30)
где - “годовая” составляющая (тренд);
- постоянная пропорциональности для j-го месяца (квартала), не меняющаяся от года к году;
- случайная ошибка.
При прогнозировании по мультипликативной модели также отдельно рассчитывается прогнозное значение каждой компоненты временного ряда (тренда и сезонной компоненты) с последующим их умножением. Тренд, как и в аддитивной модели, чаще всего аппроксимируют полиномом. Сезонная компонента представляет собой индексы сезонности. Для прогноза обычно используют средние индексы за анализируемый период.
Для определения доверительного интервала при использовании мультипликативной модели переходим к аддитивной модели логарифмированием:
.
Доверительный интервал в этом случае определим по формуле:
, (8.31)
где , - дисперсии тренда и сезонной компоненты в логарифмах. Обратным преобразованием оцениваем доверительный интервал для мультипликативной модели.
Контрольные вопросы и задания
1. Какие виды статистических оценок параметров существуют?
2. Какие основные подходы к интервальному оцениванию параметров разработаны в статистической практике?
3. В таблице приведены данные о выручке от реализации продукции предприятием, в тыс. руб.:
Период | ||||||||||||
Выручка от реализации продукции тыс.руб. |
На основе имеющихся данных построена модель:
.
а) Построить точечный прогноз на два шага вперед.
б) Построить интервальный прогноз на тот же период при достоверности прогноза 80%.
в) Результаты прогнозирования изобразить на графике.
Глава 9. Анализ и прогнозирование финансовых процессов на базе рассмотренных моделей