ГЛАВА IV . МОДЕЛИ БОКСА-ДЖЕШШНСА В ПРОГНОЗИРОВАНИИ ПРЕСТУПНОСТИ

4.1. Общее описание моделей н вх свойств

Полиномиальные предикторы, построенные с применением методов наименьших квадратов и экспоненциального сглаживания, дают приемлемые прогнозы временных рядов в том случае, если колебания этих рядов незначительны. При прогнозировании преступности нам чаще всего приходится иметь дело с сильно колеблющимися временными рядами. При использовании полиномиальных предикторов для сильно колеблющихся рядов сглаживаются колебания, учет которых может быть необходим для правильного принятия решений. В таких ситуациях для прогнозирования целесообразно применять методы, в которых прогноз ведется не изолировано по тренду и случайной компоненте, а в рамках объединенной модели. Адекватным методом для решения такого рода задач является метод Бокса- Дженкинса [14].

Поскольку прогнозирование осуществляется на основе ретроспективных данных, очевидно, что внутри временного ряда существует связь между отдельными его членами. Эта связь количественно выряжается автокорреляционной и частной корреляционной функцией ряда, которые будут служить основным инструментом при построении предикторов Бокса- Дженкинса.

Для построения моделей предварительно необходимо ввести в рассмотрение Следующие операторы: * оператор сдвига назад, определяемый как ВЩп]~Х[п-1\, отсюда

оператор сдвига вперед, определяемый как ЕХ[п]~Х[п+1] ;

разностный   оператор  со   сдвигом   назад,   определяемый   как

А¥М«А|я!-Дй4]= (l-ВЩп], то есть à=l-B=E+l.

Введенным операторам можно придать качественный статистический смысл [82]. Так, например, широко применяемый при анализе преступности показатель темпа роста может быть определен как г *^Ця+1]Щп] или ЩІг+1}=ІЩп\ и может быть отождествлен с оператором Е. Показатель темпа прироста может быть определен как

.    зф» + Г|

л. -- г

то есть саязав с разностным оператором. Легко проследить связь между темпом роста и темпом прироста

 

55-

'=1 + Л .  (4.2)

х[п]         х[п]

Для построения предиктора в рамках теории Бокса-Дженкинса используются следующие типы моделей: » авторегрессии (АР),

скользящего среднего (СС),

смешанные   модели   ыгорегрессии   скользящего   среднего

(АРСС),

смешанные    модели    авторегрессии    проинтегрированного

скользящего среднего (АРПСС).

В моделях авторе, рессии текущее зкаченне процесса выражается через предыдущие его значения и случайный импульс фі]. іісли из процесса временно исключить постоянную составляющую /І, то есть х[п] = x[fi] ~ fj, то модель авторегрессии записывается

х[п} = <р\х[п - \\ + <р2х[п- 1]+...+ф„х[п~ ij-t- £ [п],       (4,3)

или         Ч>(В)х(п}-С (»].   (4.4)

где ç3(#)=l-ç->t(B)-r/>.(6)2 -...-фр(Ву. Чтобы построить такой предиктор, необходимо ошскать/гь2 неизвестных параметра: /и, <р\ ,..., (р? , а-2, где о'-2 - дисперсия «белого шума» £ Заметим, что a практике социально-экономических исследований наибольшее распроегранение получили именно модели авторегрессни. Так, например, в [25] указывается, что "очень часто авторегреесионными оказываются временные ряды, описывающие социально-экономические явленна. Модели авшрегрессионного типа леїко интерпретируются, ибо нетрудно ІІредсІаишь себе ситуацию, когда текущее ишчение неременной зависит от одного или нескольких предыдущих."

H оіличие от модели авгорегресеин, модель скользяще;^ средне-<.І> использует некоторое число q предыдущих значений случайных импульсов.

Предиктор имеет вид.

x[n\~Ç j'i]-^]^ \п- \\-О2% \п — 2]~...~(ipÇ [п~ifj,        «'-I 5)

или         -Фч-~

где a(B}~\~ui(B)~ii2(B)'i     -и.ДЧ)*. В ло» модели неи>ь<

ЛЯЮІСЯ с+2 параметра

Если объединить т)и дье • ь.;Дс;»ї, п» ни. •:• чим • a*smape.:peccuit ско./оїч,,|л:и І   ( \І • го:

 

-56-

здесь ужер+д+2 неизвестных параметра.

В том случае, если исследуемый временной ряд проявляет явную нестационарность (а это наиболее часто встречающийся на практике случай), его удобно представить обобщенным оператором авторег-рессиы Ф(В). В обобщенном операторе авторегрессии один или несколько нулей полинома <Р(8) (то есть один или несколько корней уравнения Ф(В)=О) равны единице. Оператор Ф(В) удобно записывать в виде

Ф(В)~<р(В)(Ї-В)а,                (4.9)

"•де ф(В) » стационарный оператор авторегрессии. При этом обобщенная модель, описывающая нестационарный процесс, имеет вид:

Ф (B)xfnJ - <р(В)(1 - B)d *[и] = a(B)Ç {n}.      (4ЛО)

или        (p(B)yfa} = a(B)Ç [я],            (4.11)

где \v[n^^x\n\. Таким образом, нестационарный процесс мы будем описывать предиктором, в котором d-я разность рада (аналог производной непрерывного процесса) является стационарной. Здесь р !<q+d+2 неизвестных, которые следует определить из наблюдений. Исходной информацией для построения предиктора служат средние значения ряда, его дисперсия и автокорреляционная функция. Их выборочные значения определяются следующими выражениями:

1  й

(4.12)

(4.13)

 

п-1

 

(4.14)

 

 

 

— *ч

 

(4.15)

 

Здесь fi - среднее зютенне процесса, а? - его Дисперсия, с< - ав-токовариацшннм функция, n - автокорреляционная функция. Ста-цйойарйость рада проверяется по знакоопределенности автокорреляционной матрицы (матрицы Лорана)

'-'Ч      П   ^   ».   V-,ï

n    î   n  ••. V2

m-1          ГІ      1     і

 

•57-

которая для. стационарных рядов является положительно опр-.-ленной. На графике стационарному ряду соответствует быстро тагу • хающая автокорреляционная функция.

Увязка моделей с данными лучше всего достигается процедурой, основанной на структурной идентификации и оценивании (параметрической идентификации).

4.2. Построение предикторов

Процесс построения предиктора проведем на примере конкретного динамического ряда, характеризующего количество экономических преступлений, совершенных в г. Харькове (рис. 2.1.а). Выборочная автокорреляционная функция данного ряда х[п] представлена на рис. 4.1,а. Отсутствие тенденции к бысгрому затуханию свидетельствует о нестационарности ряда. Предположение о марковости этого процесса также отвергается, поскольку не выполняется условие r^rï I=corist.

Это приводит к необходимее!к взятил разностей и го'ледования процесса вида w[n]=(l-B)v[n]. Переход к раду к [и] соогге чтвует наличию линейного трсцда в процессе тс[п]. Ашок р->-. .ционная функция посдедователыюгдм w[, '• І р«ьедсна на ряс. 4-і.-. ?1о виду автокорреляционной функции ы ,,к,,п предположить, чїу процесс w[n] стационарен и еоответствул процессу авгорегрессин. Как указывали Дж.Боке и Г.Дженкинс, згаконерсмганые автокорреляционные функции с тевденцией к затуханию обычно соответствуют нро-цессам авторегрессии. Оценка стандартной ошибки автокорреляций

1

о</5) = «~2П + 2(п2+^2+-+^2)Р\ i>q         (4.16)

подтверждает, что автокорреляционная функция процесса ivj/t] практически затухает. Для точного установления порядка р пользуются частными автокорреляциями процесса ;v[n\. Использование частной автокорреляционной функции основано на том, что хотя при-Цесс АР порядка/? имеет бесконечно протяженную функцию аыо

КОррглЯЦИЙ, "[СМ НЄ Менее ОН МОЖеТ бЫТЬ ОППСаН ПрИ ПОУ„'Щ;;

нулевых функций от автокорреляций. Значения частнъсч   tn ляций рассчіїтьіваготся при помощи уравнений Юла - Уе г

 

— 58-

где Ф=( <fti, 0а, ... , (^)г , Гр - (г, , г2>... , />)г , Я,- матрица Лорана порядка р\ /> = 1, 2,,.., Вид частной автокорреляционной функции процесса и»[и] приведен на рис 4.1. в. Расчет стандартной ошибки частных автокорреляций (с^деьО^я^^О.Ов) указывает на то, что исследуемый процесс относится к авторегрессии второго порядка (схема Юла) со стационарной первой разностью

ф](1-ЯХ1~<Р|Я-?2Я2) = £М-        (4.Î8)

Коэффициенты pi и <рі находятся решением системы уравнений

Юла-Уокера, которая для данного конкретного случая приобретает вид

И =^

-0.142,

 

«.=^-=-40927,

 

(4.19)

 

причем эти решения удовлетворяют необходимым условиям устойчивости -1 < (fo < 1, фі + #2 < 1, (fa - pi < і. Остаточная дисперсия такой модели оценивается по формуле

а? = с0(1 - g>[i\ - у>2Ъ ) = 0.066,         ,       (4.20)

С

где Со=сс,2 =0.088, a среднее значение процесса w =0.0643. Постоянный млен этого процесса меньше своей стандартной ошибки и поэтому им можно пренебречь. Окончательную модель числа экономических преступлений, совершаемых в г. Харькове, мы получаем в тще

(Н-0.142В+0.0927В2 )(1-В}х[п\ =*{«],              (4.21)

или

х[п\ = 0.85&Ф-13-0.049*[я-2]~0,0927ф-3}+ £ до.   (4.22) с дисперсией «белого шума» а/ =0.066.

В данном примере вычисление коэффициентов предиктора осуществлялось с помощью стандартных оценок Юла-Уокера, являющихся по сути МНК оценками.

 

-59-

 

І.*

 

 

 

її    1    1    т

*- Г

f

f

f   Г

і

 

1       І

10

11

11    1»

V

 

а)

І,»

 

o,s

в, 12

.

 

'                г." r : •••••'        ....J-...J.-..

 

І , *..   І    j...                            л .;     . ..*               ,. . . :        •               

-O.S-

 

6}

в,2і

•О.Є88

•0.2&

Рис.4.1.

Рассмотрим несколько иной подход к вычислению антореір». сионного предиктора (отличный от предложенного в [І4]). Запишем уравнение предиктора в виде

 

*=0

А=0

Неизвестные коэффициенты определяются минимизацией крч терия

где С, - соответствующие автоковариации, M - символ маи'м«пиче-ского ожидания.

Оптимальные оценки коэффициентов находятся рвшешк-м системы алгебраически* уравнений

k -О,   I,...,  p.

Эта система из {/Н-1)-го линейного алгебраическою > равнения с (р+П неизвестными имеет неособую симметричную магршду, так-как Cic'C.t- . Поэтому система

 

1,...,      /7

может быть однозначно разрешена относьн ';ьни н-вариация исходного ,.-.ч -л ненулевая и сие !<• ма нме<,

ЛН4ЛОГИЧНО Пре !! '. ШЦСМу бЫЛИ HOCij   1-і .'.Ы lip,.. СО8, Лир дКІерИЗ) і".!'»' І КОЭффиЦИеНТ ЧИШ.МЇІШ, СО»

кра*и (л:-.) и коэффициент хищений, совершенны ' (хг) в г. Харькове (см. рис 4.2. ). У этих процессов доскиї ас -ся. іксіє двукратного взятия разницей. /' .ные 4:,'' i!i's;! в орыч разностей этих процессов ш 4.3., а ча^іньтс 'Ійгокорреляционньїе функции - на ри»,

 

I

 

 

астраты

.^раої. гь і ециои

, »г .-pï,c

 

']   Xi.Xj

 

T-t-t-t- 1 ;    ,

 

. %

 

(9

го-

 

*ïî

 

s

Ш'О

S'B

 

 

 

 

 

Г   .    .. t

 

-Z9-

 

S'8

 

s   s

 

s •

 

І

Ju.

 

На основании згой информации были получены модели вида

 

г{1 + 0.6825 +

 

0.008,

 

(4.27,

 

ИЛИ

І Х|Іп]«1.318^{я-І]-йЗІ9х][я~2}4-0.325хІ[п-3)-

- 0.504*1 [и- 4] + £ ! И

(4.28)

- 0.3 1 5*2 [я - 4J + ? 2 M + 0-008

Настоявшие расчеты подтверждают целесообразность применения для прогнозирования преступности предикторов автерегресси-енного тиііа. Приведенная процедура построения предикторов по сравнению с рассмотренными ранее обладает тем преимуществом, что позволяет проводить предварительный анализ исследуемых показателей преступности и определять структуру предиктора на ос Нове корреляционного анализа. Однако вычисление коэффициенте модели с помощью оценок Юла-Уокера представляют собой достаточно громоздкую процедуру. Кроме того, ей присущи все недостатки метода наименьших квадратов, о которых мы говорили ранее. В то же время методы экспоненциального еглажквашя, неключаю-£i;ic л— д нгдсггг~ков, не зъгт^зтт в себя авторегр^ссионные структуры.

Вводя в рассмотрение критерий

 

*=0

 

/=1

 

по аналогии с методом наименьших квадратов можно показать, что неизвестные коэффициенты могут быть определены путем решения системы уршзшя-шй вида

(4.30)

где

 

поя/чае гея

И,

замено

1-ого

столбца      столбцом .-•-   4п -k~l],...,J^ax:k[n~k]x[K~k-'pj)T,     Следует

тметил, что ори о=1 оценки, получаемые этим способоМі совпаают с оценками Юла-7охера.

 

~65«

При прогнозировании преступности настоящий алгоритм удоо-нее использовать в рекуррентной форме. Запишем критерий идентификации в виде

*=0

 

= vr[n-k}A[n]v[n-k],

 

(4.31)

 

где     Ф[я] =

 

(I

 

О    1

 

a

a'

o

Минимизация этого критерия позволяет пол, "йть решение аналогичное тому, которое может быть получено при использования

обобщенного метода наименьших кпадрагок [9 /] и имеет вад

Ф[«] = (х г 1»]А[п]х[п] f'? т[п}Л{п}х[п\,          (4.32)

Т

где          " л'

Введем обозначения

Переходя к рекуррентной форм записи, получим:

 

I   L[m]~X[vi, Используя рекуррентную форму обращения матриц, получим:

 

(4.33)

 

 

 

«

 

м   п [« *** «J

 

(4.34)

 

 

 

Подставив s (4.32) выраж

! ОЦ«Н0К КОэффШи

 

.;<м алгоритм •;ia n виде

 

-J

 

Данный алгоритм зельт близок к ироде,. ; р

0=1 •       Іег рекуррентиую фор?.(>- мето;.

•їаметим, однако, что дачная процедура > значениях а, близких s единице, при длительном І І     і. , ,'••:','••'-, уемон объекта, матрица Ф[и]

 

«[!!  ;  І   ,

;

 

-66

обусловленной и процедура не обеспечивает удовлетворительного качества предсказания. Эти трудности могут быть преодолены использованием, так называемых, адаптивных модифицированных ai-горитмов одновременного действия [91], которые мы рассмотрим ниже.

Рассмотрим теперь собственно процесс прогнозирования с использованием предикторов Бокса-Дженкинса [І4, 85]. Здесь в качестве основного уравнения используется выражение для АРПСС модели

х[« + /] = <р {х[п + / - 1]+...+ррх[п +1 - р] + С [п + !] -

- «І£ [п +1 - \\-...-ачС [п + / - q].         (4.36)

Другая форма записи АРПСС модели связывает будущие значения последовательность х[п + 1] с бесконечной линейной комбинацией случайных импульсов <* [п]:

00

Л,            (4.3?)

где у/<г\ и веса ^; определяются из соотношения

пугсм прираишншшя коэффициентов при одинаковых, степенях оператора В в правой и левых частях уравнения (4.3'м Плпадыуа (4.37), можно вычислить прогнозы хп±,[!\ и х,Д/ + 1] оуд>щшо ша-чения XJ/J+/+1], сделанные в моменты времени п+1 и и еоочиечеч-венко:

[w-f !J + ^+i^ (п]+У'І^С {/І-Ij-K,.,

'î=î^f+l^ in]+¥l+2^ ['• " M"*"---

Вычитая второе уравнение системы (4.39) из перього получнч, что

Отсюда следует, что предсказание величины х[п+1+1\ в момент п+1 отличается от прогноза этой же величины в момент п на ошибку предсказания на первом шаге <£{«+!], умноженную па кол|)фици~ еят у j. Поэтому, как только становится известной величина \[п *-/], •можно вычислить | [и-^î]•--xtи^ 1]-і[«ч-1] и >множить «со предсказания для периодов п+2, я+3,..., п+\ по формуле (4.40).

 

-67-

«все книги     «к разделу      «содержание      Глав: 13      Главы:  1.  2.  3.  4.  5.  6.  7.  8.  9.  10.  11. >