ГЛАВА IV . МОДЕЛИ БОКСА-ДЖЕШШНСА В ПРОГНОЗИРОВАНИИ ПРЕСТУПНОСТИ
4.1. Общее описание моделей н вх свойств
Полиномиальные предикторы, построенные с применением методов наименьших квадратов и экспоненциального сглаживания, дают приемлемые прогнозы временных рядов в том случае, если колебания этих рядов незначительны. При прогнозировании преступности нам чаще всего приходится иметь дело с сильно колеблющимися временными рядами. При использовании полиномиальных предикторов для сильно колеблющихся рядов сглаживаются колебания, учет которых может быть необходим для правильного принятия решений. В таких ситуациях для прогнозирования целесообразно применять методы, в которых прогноз ведется не изолировано по тренду и случайной компоненте, а в рамках объединенной модели. Адекватным методом для решения такого рода задач является метод Бокса- Дженкинса [14].
Поскольку прогнозирование осуществляется на основе ретроспективных данных, очевидно, что внутри временного ряда существует связь между отдельными его членами. Эта связь количественно выряжается автокорреляционной и частной корреляционной функцией ряда, которые будут служить основным инструментом при построении предикторов Бокса- Дженкинса.
Для построения моделей предварительно необходимо ввести в рассмотрение Следующие операторы: * оператор сдвига назад, определяемый как ВЩп]~Х[п-1\, отсюда
оператор сдвига вперед, определяемый как ЕХ[п]~Х[п+1] ;
разностный оператор со сдвигом назад, определяемый как
А¥М«А|я!-Дй4]= (l-ВЩп], то есть à=l-B=E+l.
Введенным операторам можно придать качественный статистический смысл [82]. Так, например, широко применяемый при анализе преступности показатель темпа роста может быть определен как г *^Ця+1]Щп] или ЩІг+1}=ІЩп\ и может быть отождествлен с оператором Е. Показатель темпа прироста может быть определен как
. зф» + Г|
л. -- г
то есть саязав с разностным оператором. Легко проследить связь между темпом роста и темпом прироста
55-
'=1 + Л . (4.2)
х[п] х[п]
Для построения предиктора в рамках теории Бокса-Дженкинса используются следующие типы моделей: » авторегрессии (АР),
скользящего среднего (СС),
смешанные модели ыгорегрессии скользящего среднего
(АРСС),
смешанные модели авторегрессии проинтегрированного
скользящего среднего (АРПСС).
В моделях авторе, рессии текущее зкаченне процесса выражается через предыдущие его значения и случайный импульс фі]. іісли из процесса временно исключить постоянную составляющую /І, то есть х[п] = x[fi] ~ fj, то модель авторегрессии записывается
х[п} = <р\х[п - \\ + <р2х[п- 1]+...+ф„х[п~ ij-t- £ [п], (4,3)
или Ч>(В)х(п}-С (»]. (4.4)
где ç3(#)=l-ç->t(B)-r/>.(6)2 -...-фр(Ву. Чтобы построить такой предиктор, необходимо ошскать/гь2 неизвестных параметра: /и, <р\ ,..., (р? , а-2, где о'-2 - дисперсия «белого шума» £ Заметим, что a практике социально-экономических исследований наибольшее распроегранение получили именно модели авторегрессни. Так, например, в [25] указывается, что "очень часто авторегреесионными оказываются временные ряды, описывающие социально-экономические явленна. Модели авшрегрессионного типа леїко интерпретируются, ибо нетрудно ІІредсІаишь себе ситуацию, когда текущее ишчение неременной зависит от одного или нескольких предыдущих."
H оіличие от модели авгорегресеин, модель скользяще;^ средне-<.І> использует некоторое число q предыдущих значений случайных импульсов.
Предиктор имеет вид.
x[n\~Ç j'i]-^]^ \п- \\-О2% \п — 2]~...~(ipÇ [п~ifj, «'-I 5)
или -Фч-~
где a(B}~\~ui(B)~ii2(B)'i -и.ДЧ)*. В ло» модели неи>ь<
ЛЯЮІСЯ с+2 параметра
Если объединить т)и дье • ь.;Дс;»ї, п» ни. •:• чим • a*smape.:peccuit ско./оїч,,|л:и І ( \І • го:
-56-
здесь ужер+д+2 неизвестных параметра.
В том случае, если исследуемый временной ряд проявляет явную нестационарность (а это наиболее часто встречающийся на практике случай), его удобно представить обобщенным оператором авторег-рессиы Ф(В). В обобщенном операторе авторегрессии один или несколько нулей полинома <Р(8) (то есть один или несколько корней уравнения Ф(В)=О) равны единице. Оператор Ф(В) удобно записывать в виде
Ф(В)~<р(В)(Ї-В)а, (4.9)
"•де ф(В) » стационарный оператор авторегрессии. При этом обобщенная модель, описывающая нестационарный процесс, имеет вид:
Ф (B)xfnJ - <р(В)(1 - B)d *[и] = a(B)Ç {n}. (4ЛО)
или (p(B)yfa} = a(B)Ç [я], (4.11)
где \v[n^^x\n\. Таким образом, нестационарный процесс мы будем описывать предиктором, в котором d-я разность рада (аналог производной непрерывного процесса) является стационарной. Здесь р !<q+d+2 неизвестных, которые следует определить из наблюдений. Исходной информацией для построения предиктора служат средние значения ряда, его дисперсия и автокорреляционная функция. Их выборочные значения определяются следующими выражениями:
1 й
(4.12)
(4.13)
п-1
(4.14)
— *ч
(4.15)
Здесь fi - среднее зютенне процесса, а? - его Дисперсия, с< - ав-токовариацшннм функция, n - автокорреляционная функция. Ста-цйойарйость рада проверяется по знакоопределенности автокорреляционной матрицы (матрицы Лорана)
'-'Ч П ^ ». V-,ï
n î n ••. V2
m-1 ГІ 1 і
•57-
которая для. стационарных рядов является положительно опр-.-ленной. На графике стационарному ряду соответствует быстро тагу • хающая автокорреляционная функция.
Увязка моделей с данными лучше всего достигается процедурой, основанной на структурной идентификации и оценивании (параметрической идентификации).
4.2. Построение предикторов
Процесс построения предиктора проведем на примере конкретного динамического ряда, характеризующего количество экономических преступлений, совершенных в г. Харькове (рис. 2.1.а). Выборочная автокорреляционная функция данного ряда х[п] представлена на рис. 4.1,а. Отсутствие тенденции к бысгрому затуханию свидетельствует о нестационарности ряда. Предположение о марковости этого процесса также отвергается, поскольку не выполняется условие r^rï I=corist.
Это приводит к необходимее!к взятил разностей и го'ледования процесса вида w[n]=(l-B)v[n]. Переход к раду к [и] соогге чтвует наличию линейного трсцда в процессе тс[п]. Ашок р->-. .ционная функция посдедователыюгдм w[, '• І р«ьедсна на ряс. 4-і.-. ?1о виду автокорреляционной функции ы ,,к,,п предположить, чїу процесс w[n] стационарен и еоответствул процессу авгорегрессин. Как указывали Дж.Боке и Г.Дженкинс, згаконерсмганые автокорреляционные функции с тевденцией к затуханию обычно соответствуют нро-цессам авторегрессии. Оценка стандартной ошибки автокорреляций
1
о</5) = «~2П + 2(п2+^2+-+^2)Р\ i>q (4.16)
подтверждает, что автокорреляционная функция процесса ivj/t] практически затухает. Для точного установления порядка р пользуются частными автокорреляциями процесса ;v[n\. Использование частной автокорреляционной функции основано на том, что хотя при-Цесс АР порядка/? имеет бесконечно протяженную функцию аыо
КОррглЯЦИЙ, "[СМ НЄ Менее ОН МОЖеТ бЫТЬ ОППСаН ПрИ ПОУ„'Щ;;
нулевых функций от автокорреляций. Значения частнъсч tn ляций рассчіїтьіваготся при помощи уравнений Юла - Уе г
— 58-
где Ф=( <fti, 0а, ... , (^)г , Гр - (г, , г2>... , />)г , Я,- матрица Лорана порядка р\ /> = 1, 2,,.., Вид частной автокорреляционной функции процесса и»[и] приведен на рис 4.1. в. Расчет стандартной ошибки частных автокорреляций (с^деьО^я^^О.Ов) указывает на то, что исследуемый процесс относится к авторегрессии второго порядка (схема Юла) со стационарной первой разностью
ф](1-ЯХ1~<Р|Я-?2Я2) = £М- (4.Î8)
Коэффициенты pi и <рі находятся решением системы уравнений
Юла-Уокера, которая для данного конкретного случая приобретает вид
И =^
-0.142,
«.=^-=-40927,
(4.19)
причем эти решения удовлетворяют необходимым условиям устойчивости -1 < (fo < 1, фі + #2 < 1, (fa - pi < і. Остаточная дисперсия такой модели оценивается по формуле
а? = с0(1 - g>[i\ - у>2Ъ ) = 0.066, , (4.20)
С
где Со=сс,2 =0.088, a среднее значение процесса w =0.0643. Постоянный млен этого процесса меньше своей стандартной ошибки и поэтому им можно пренебречь. Окончательную модель числа экономических преступлений, совершаемых в г. Харькове, мы получаем в тще
(Н-0.142В+0.0927В2 )(1-В}х[п\ =*{«], (4.21)
или
х[п\ = 0.85&Ф-13-0.049*[я-2]~0,0927ф-3}+ £ до. (4.22) с дисперсией «белого шума» а/ =0.066.
В данном примере вычисление коэффициентов предиктора осуществлялось с помощью стандартных оценок Юла-Уокера, являющихся по сути МНК оценками.
-59-
І.*
її 1 1 т
*- Г
f
f
f Г
і
1 І
10
11
11 1»
V
а)
І,»
o,s
в, 12
.
' г." r : •••••' ....J-...J.-..
І , *.. І j... л .; . ..* ,. . . : •
-O.S-
6}
в,2і
•О.Є88
•0.2&
Рис.4.1.
Рассмотрим несколько иной подход к вычислению антореір». сионного предиктора (отличный от предложенного в [І4]). Запишем уравнение предиктора в виде
*=0
А=0
Неизвестные коэффициенты определяются минимизацией крч терия
где С, - соответствующие автоковариации, M - символ маи'м«пиче-ского ожидания.
Оптимальные оценки коэффициентов находятся рвшешк-м системы алгебраически* уравнений
k -О, I,..., p.
Эта система из {/Н-1)-го линейного алгебраическою > равнения с (р+П неизвестными имеет неособую симметричную магршду, так-как Cic'C.t- . Поэтому система
1,..., /7
может быть однозначно разрешена относьн ';ьни н-вариация исходного ,.-.ч -л ненулевая и сие !<• ма нме<,
ЛН4ЛОГИЧНО Пре !! '. ШЦСМу бЫЛИ HOCij 1-і .'.Ы lip,.. СО8, Лир дКІерИЗ) і".!'»' І КОЭффиЦИеНТ ЧИШ.МЇІШ, СО»
кра*и (л:-.) и коэффициент хищений, совершенны ' (хг) в г. Харькове (см. рис 4.2. ). У этих процессов доскиї ас -ся. іксіє двукратного взятия разницей. /' .ные 4:,'' i!i's;! в орыч разностей этих процессов ш 4.3., а ча^іньтс 'Ійгокорреляционньїе функции - на ри»,
I
астраты
.^раої. гь і ециои
, »г .-pï,c
'] Xi.Xj
T-t-t-t- 1 ; ,
. %
(9
го-
*ïî
s
Ш'О
S'B
Г . .. t
-Z9-
S'8
s s
s •
І
Ju.
На основании згой информации были получены модели вида
г{1 + 0.6825 +
0.008,
(4.27,
ИЛИ
І Х|Іп]«1.318^{я-І]-йЗІ9х][я~2}4-0.325хІ[п-3)-
- 0.504*1 [и- 4] + £ ! И
(4.28)
- 0.3 1 5*2 [я - 4J + ? 2 M + 0-008
Настоявшие расчеты подтверждают целесообразность применения для прогнозирования преступности предикторов автерегресси-енного тиііа. Приведенная процедура построения предикторов по сравнению с рассмотренными ранее обладает тем преимуществом, что позволяет проводить предварительный анализ исследуемых показателей преступности и определять структуру предиктора на ос Нове корреляционного анализа. Однако вычисление коэффициенте модели с помощью оценок Юла-Уокера представляют собой достаточно громоздкую процедуру. Кроме того, ей присущи все недостатки метода наименьших квадратов, о которых мы говорили ранее. В то же время методы экспоненциального еглажквашя, неключаю-£i;ic л— д нгдсггг~ков, не зъгт^зтт в себя авторегр^ссионные структуры.
Вводя в рассмотрение критерий
*=0
/=1
по аналогии с методом наименьших квадратов можно показать, что неизвестные коэффициенты могут быть определены путем решения системы уршзшя-шй вида
(4.30)
где
поя/чае гея
И,
замено
1-ого
столбца столбцом .-•- 4п -k~l],...,J^ax:k[n~k]x[K~k-'pj)T, Следует
тметил, что ори о=1 оценки, получаемые этим способоМі совпаают с оценками Юла-7охера.
~65«
При прогнозировании преступности настоящий алгоритм удоо-нее использовать в рекуррентной форме. Запишем критерий идентификации в виде
*=0
= vr[n-k}A[n]v[n-k],
(4.31)
где Ф[я] =
(I
О 1
a
a'
o
Минимизация этого критерия позволяет пол, "йть решение аналогичное тому, которое может быть получено при использования
обобщенного метода наименьших кпадрагок [9 /] и имеет вад
Ф[«] = (х г 1»]А[п]х[п] f'? т[п}Л{п}х[п\, (4.32)
Т
где " л'
Введем обозначения
Переходя к рекуррентной форм записи, получим:
I L[m]~X[vi, Используя рекуррентную форму обращения матриц, получим:
(4.33)
«
м п [« *** «J
(4.34)
Подставив s (4.32) выраж
! ОЦ«Н0К КОэффШи
.;<м алгоритм •;ia n виде
-J
Данный алгоритм зельт близок к ироде,. ; р
0=1 • Іег рекуррентиую фор?.(>- мето;.
•їаметим, однако, что дачная процедура > значениях а, близких s единице, при длительном І І і. , ,'••:','••'-, уемон объекта, матрица Ф[и]
«[!! ; І ,
;
-66
обусловленной и процедура не обеспечивает удовлетворительного качества предсказания. Эти трудности могут быть преодолены использованием, так называемых, адаптивных модифицированных ai-горитмов одновременного действия [91], которые мы рассмотрим ниже.
Рассмотрим теперь собственно процесс прогнозирования с использованием предикторов Бокса-Дженкинса [І4, 85]. Здесь в качестве основного уравнения используется выражение для АРПСС модели
х[« + /] = <р {х[п + / - 1]+...+ррх[п +1 - р] + С [п + !] -
- «І£ [п +1 - \\-...-ачС [п + / - q]. (4.36)
Другая форма записи АРПСС модели связывает будущие значения последовательность х[п + 1] с бесконечной линейной комбинацией случайных импульсов <* [п]:
00
Л, (4.3?)
где у/<г\ и веса ^; определяются из соотношения
пугсм прираишншшя коэффициентов при одинаковых, степенях оператора В в правой и левых частях уравнения (4.3'м Плпадыуа (4.37), можно вычислить прогнозы хп±,[!\ и х,Д/ + 1] оуд>щшо ша-чения XJ/J+/+1], сделанные в моменты времени п+1 и и еоочиечеч-венко:
[w-f !J + ^+i^ (п]+У'І^С {/І-Ij-K,.,
'î=î^f+l^ in]+¥l+2^ ['• " M"*"---
Вычитая второе уравнение системы (4.39) из перього получнч, что
Отсюда следует, что предсказание величины х[п+1+1\ в момент п+1 отличается от прогноза этой же величины в момент п на ошибку предсказания на первом шаге <£{«+!], умноженную па кол|)фици~ еят у j. Поэтому, как только становится известной величина \[п *-/], •можно вычислить | [и-^î]•--xtи^ 1]-і[«ч-1] и >множить «со предсказания для периодов п+2, я+3,..., п+\ по формуле (4.40).
-67-
«все книги «к разделу «содержание Глав: 13 Главы: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. >