ГЛАВА VIII. МЕТОДЫ ПОСТРОЕНИЯ ОБОБЩЕННЫХ ПРОГНОЗОВ ПОКАЗАТЕЛЕЙ ПРЕСТУПНОСТИ
При анализе состояния и динамики развития отдельных показателей преступности возникает вопрос выбора того или иного алгоритма прогнозирования, наилучшим образом приспособленного к условиям данной задачи. Ответить однозначно на этот вопрос вряд ли представляется возможным, так как в каждой конкретной ситуации любой из алгоритмов может обеспечить наилучшую точность прогноза. Необходимо заметить, что прогнозирование показателей преступности с абсолютной точностью принципиально невозможно. Это объясняется влиянием на формирование преступности различных социально-экономических факторов.
Опыт показывает, что основные затруднения связаны с обоснованным выбором структуры модели прогнозируемого показателя. Выбор структуры в принципе можно осуществлять на основании информации о характере поведения корреляционных и автокорреляционных функций. Однако эта информация в условиях не-с~'.4;п:.згч:ссг: изучаемых процессов стареет, теряет свою ценность, прогнозы в силу этого получаются малообоснованными.
Одним из методов повышения надежности и точности прогнозов в условиях нестационарного изменения показателей преступности является параллельное прогнозирование с помощью различных предикторов и последующее построение обобщенного прогноза.
Использование комплекса методов для прогнозирования приводит к получению множества различных прогнозов. Процедура их обобщенна позволяет на их основе построить единый прогноз, учитывающий положительные черты входящих в него частных прогнозов.
8.1. Одноразовые процедуры обобщения прогнозов
Пусть имеется вектор частных прогнозов конкретного показате-
A *f*
v. преступности л**(хі,..»-%) f полученных с использованием системы, состоящей из m различных предикторов. На основании
л
її"!о набора А' необходимо построить обобщенный прогноз х, г-'-н'мольный в смысле ниюторого наперед заданного критерия.
Рассмотрим нросіейшую ситуацию, когда система моделей соси ні и 7 дв>х однофакгорьых уравнений регрессии:
119-
f *i= 1*2=
(8.1)
где
= --1)1 <Г|
2 °0 2 -—4)2
(82}
" ^
во , of, о/ - выборочные оценки дисперсий
bjKKtvtf
х, gi, 82 соответственно, /ц- опенки коэффициещоа Вд"" Г
корреляции.
Обобщенный прогноз преде ґавим в виде аыралс-тн
2 ,2 ,2
'^' + уо"- (83)
Коэффициешы уравнения (8.3) находя їси н> (ем
(8.4)
ні о ноіволяеі лолучшъ
,„1,2 _ ^/ _
Аналогично моїуі бьпь получены формулы, цоз^оїй оі,>щссівнгь обобщение на основе многофакторцух >D ^ рсірессни. 11)сгь предикторы кадеты а ыгыирной формс
(86)
Тогда м.н.к. оценки i«j «ффидисиюь іірс.иікаїрои
(jf,*<37<G 'G' \
•лі і
Ьслн } равнение uoutJiiietiHiîïu нрсмніяа иничоя ь илдс
' 1 ?
ïd ею коэффшшеш.а находятся реіиеі І.?, систе : І (,,,,., ,,
•••- *І
120-
Огсюда
(8.10)
где
(8.11)
Как видно, даже в достаточно простом случае обобщения двух линейных уравнений вычисления становятся громоздкими.
Более естественно и просто выглядит процесс обобщения, о яованный на обработке только откликов частных предикторов. В этом случае обобщенный прогноз показателя строится в форме
(8.12)
Аналогично предыдущему рассмотрим вначале процесс обобщения на основе двух прогнозов х\ и % с дисперсиями 0}2 и а? соответственно. Тогда дисперсия обобщенного прогноза имеет вид
Дифференцируя (8.13) по с я приравнивая результат к нулю,
получаем
2
а>2 -2<у\&І ,8 .,*.
с___ £_ i_ . (gJ4ï
При этом обобщенный прогноз имеет вид
• (8.15)
Весовой коэффициент с может быть определен и . другим образом. Введя вектора ошибок частных прогнозов vi и v2, можно показать, что
(8.16)
Для уточнения коэффициента с можно использовать рекуррентную процедуру:
фі] =
:є 0 < a < 1 - параметр сглаживания.
vl v\
(8.17)
-121-
Объединение вектора частных прогнозов осуществляется путем последовательного попарного комбинирования отдельных частных прогнозов. В данном случае обобщение производится на основании линейного взвешивания частных прогнозов.
Рассмотрим метод, не постулирующий линейности обобщенного прогноза. Пусть опять-таки имеется два прогноза х\ и Х2. Ошибки прогнозирования v, = х - х,- (І =1, 2) интерпретируются как реализации некоторых случайных величин с нормальным распределением, параметры которого не зависят от Х{. Предположим, что двумерная случайная величина (vb v2 ) также имеет нормальное распределение с нулевыми математическими ожиданиями, известными дисперсиями <Т;2 и известным коэффициентом корреляции Г!2.
Обобщенный прогноз находится с помощью метода максимального правдоподобия, при этом решение задачи сводится к минимизации квадратичной формы
, (8.19)
(8.20) (8.21)
(8.22)
—* Л| П А Лу | | ^ -*2 /О 1 О\
."A'irrbrJ •
01
Применяя обычную технику вычислений, находим:
of-
erf •»• of -
ИЛИ X ss CjXj -Ь С2*2 >
ГДЄ С\ + Ç2 as 1.
Заметим, что при Г|2=0 имеет место соотношение
11
т.е. взвешивание прогнозов производится пропорционально их точности.
В общем случае объединения m частных прогнозов хц для которых ошибки х-х( имеют в качестве совместного распределения вероятностей нормальный закон с квадратичной формой
где M-R'1 и Я * ковариационная матрица.
Для vi, ..., vm) требование минимизации функции
(8.23)
/ І приводит к следующей Формуле обзбш*тюго прогноза:
-122-
(8.24)
/
Из (8.24) видно, что нахождение обобщенного прогноза сводится к оценке и обращению ковариационной матрицы R. Как указывает Э Б. Ершов [36], лишь при т = 2 и 3 для весовых коэффициентов СІ существуют достаточно простые зависимости, связы-
вающие ИХ С ДИСПерСИЯМИ <Т,2 И Коэффициентами КОрреЛЯЦИИ Г ij.
Более удобным и перспективным представляется подход к обобщению прогнозов, предложенный в [П9]. При этом задача заключается в том, что необходимо обобщить частные проі нозы отдельных предикторов таким образом, чтобы полученный прогноз отвечал заранее выбранному критерию эффективности и оценка х истинного значения х была несмещенной, т.е. х~М{х}:
x = f(xi,...,xm,clj...,ctn), (8,25)
где/- оператор обобщения, с\, ... сю - искомые параметры. Обобщенный прогноз строится в классе линейных функций:
i=\ Условие несмещенности оценок означает, ч го
х » М{х] = A
(g.28)
(=1
В качестве критерия обобщения используется стандартный крите рий минимума суммы квадратов ошибок прогнозирования:
{§.29 s
Поскольку в нашем случае информация снимается дискретно, критерий (8.29) принимает вид;
и т
Q = Z 4/1 -
* п,ш ,
(8.30)
при пыполнений условия (8,28),
Настоящая задача «а условный экстрем} •; оыть решен/
применением неі>Ііределенньи множа; ел лі /1а!!>пнжа. Тогда оптимизируемый критерий приобретает
n m
Q = Z 4Л
jc/m + A le,- - 1 1 -» min ,
(8.31)
где Л - неопределенный множитель Лаіранжа,
Дифференцируя (8.31) по с( и А, получаем систему линейных
уравнений вида
J-1
/]*,- Ш,
(8.32)
Решение системы (8.32) несложно получить с помощью известных методов линейной алгебры. Теоретическому їісследоваиию и обоснованию подобного подхода и обобщению прогнозов посвящена работа [28]. Здесь в рассмотрение вводится ковариационная матрица ошибок частных прогнозов
(8.33)
flll •'• Р\т
Ы • : .
{Pml ••• Ртт) Обобщенный прогаоз ищется в форме (8.26), при этом его дисперсия имеет вид
mm
(8.34)
Вводя неопределенный множитель Лаграюка и дифференцируя выражение
„mm ( m \
ffj » 2 IX-c/p y + Л{ Zq ~ lj, (8-35)
получаем систему уравнений
m
+ Л, (k в 1,..,,т)
(8,36)
и — 2^Cj -~ Ï.
i=l Приравнивание этих частных производных к нулю дает:
-124-
1 ... 1 О Al ••• Pirn l
Phim
* \
/г
ffl о
loj
(8.37)
В блочной форме (8.37) можно записать как
(8.38)
:*Vf'm о у Vn
/
/vu /J W'
где С* - вектор-столбец весов, а /„, Ош - вектор-столбцы из /и единиц и т нулей соответственно. Обозначив обратную матриц) с (8.38) через
fi M)
U ЛІ»
получаем
fl 0 ... ti
О 1 О
І
M) о
.(8.39)
Из (8.38) следует, что
Тогда минимум (8.34) достигается при
г*Т ог* - ( ІТ d-\ , ч-l С KL -(JmK lm)
В частном случае, при т=2, используя (8.41), можно получить:
1 - АІ+Р22 -
Следовательно,
£шцг_2.о.
(8.40) (8.42)
(8.43) (8.44)
Отсюда
jn £f\\ ^ <^Qnàa^P22 аналої ично . Следовательно,
°iOmin
,/352 ) ' то есгь -Дисперсия обобщенного арогноча не превышает дисперсии любого из частных прогнозов.
Предположим теперь, что на базе яИ частных нрогночов был построен обобщенный с дисперсией оь2шш Если реализовать т~ый прогноз и объединить его с уже имеющимися, то нол) чаем прогноз
мк персики c?0min- Рассуждая аналої ично Ііре(іьіп>пі.'му, иолуча
прогнозов дисперсия обобщенного прогноза не превышает дисперсии любого из частных прогнозов.
" + a\ как
При отсутствии корреляция между ошибками частных
прогнозов справедлив более строгий результат:
111 1
.+ 4- —
„г
неизвестны, поэтому
°0rain
На практике параметры Гд, как правило, вместо матрицы R берется ее оценка.*
y-l
y=l
(8.45)
Можно показать [28], что
. (8.46)
Таким образом, [п-т + \}(I^R~llm)~l является несмещенной оценкой для дисперсии ошибки обобщенного прогноза, когда п>т+\.
Весьма интересным является вопрос о возможности появления отрицательных весов при частных прогнозах. В случае двух частных прогнозов при отсутствии корреляции между ошибками, веса с\ и ci» очевидно, всегда положительны. Если же такая корреляция существует, то, как было показано ранее,
|...~
(8-47)
Очевидно, что t'i<0, если Гц >ff>/(Tj, и сз<0, если ГІ2 >сгі/оа . Без потери общносги, полагая, что af*cr\t получаем ci<0 (так как fia^O), a С; может быть положительным в зависимости от значений Гп, о\, C3j. Аналогично показывается, что при обобщении т ппогнозов лак-же мо»ут возникать о грицагельные веса
~ І26-8.2, Адаптивное обобщение прогнозов
При прогнозирований преступности решение систем уравнений (8.32) или (8.40) на каждой итерации весьма затруднительно. Использование адаптивного подхода позволяет обойти возникающие вычислительные трудности. Рассмотрим процедуру настройки неизвестных весовых коэффициентов и множителя Ла-гранжз в виде
(8.48)
где ус и /д - множители, задающие смещение в пространстве па-р метров на каждой итерации, Q определяется выражением (8.31). Вводя в рассмотрение ошибку обобщенного прогноза v[»l = фт} - S^n\, процедуру (8.48) можно записать как
] = С[и -
(8.4?)
где / - (mxl) вектор-столбец, состоящий из единиц.
Ввода аналогично предыдущему функцию 6{п] и потребовав м«сймальяой скорости убывания ошибок, можно найти
ГеЫ
2v2[n] ~ Цп ~ Щ1 - СТ[п -1]/)
(8.50)
Тогда оптимальная настройка неизвеетшк весовых коэффициентов будет осуществляться сої л;
А Г«] » Л [п -1}+Гл1яКС[и- 1К -1), (4.51)
f»c 0 < а < 1 - коэффициент, введенный для уменьшения влияния помех на процесс настройки, а ^я выбирается так же, как величина рабочего шага в градиентных методах. Результаты моделирования да ЭВМ показывают, чго зідаедае уд практически не влияет на скорость tfôctjpfflffi й%м>вмх козффиІШаитов С.
- 127 -
На рисунках 8.1-8.5 приведены результаты статистического моделирования на ЭВМ адаптивного алгоритма построения обобщенного прогноза. Обобщение проводилось по моделям различных структур, рассмотренных в предыдущих разделах. Исследовалось влияние а и Я на скорость сходимосги алгоритма. Как видно из графиков, уменьшение а ведет к увеличению периода обучения, од« наш улучшает сглаживающие свойства алгоритма и, наоборот, при больших а обобщенная модель практически сразу переходит в режим прогнозирования, но при этом чувствительна к выбросам прогнозируемого процесса. Влияние неопределенного мно/кигеля Лагранжа А проявляется значительно слабее' s режиме прогнозирования А практически не ишеняегея.
Адаптивный алгоритм обобщения (8.51) относится к классу одношаговых алгоритмов типа Канмажа и ему присущи все недостатки подобных алгоритмов (см. параграф 5.2.). Рекуррентную процедуру обобщенного прогнозирования, учитывающую большой обьем предыстории, можно построй п» на основе рекуррентного метода наименьших квадратов (см, ІІараІраф 6.2.) Для этого введем критерий обобщения
Q f -С*!»! ~ Х[п]С\п])Т(Х[п}
- Î) , (8.52)
гяеХ\п] *=• (х[\], х{2],..., х[п\)г, %{п\- (их/и) - маїрица, составленная из частных прогнозов.
Частные производные (8.52) по С и Л имеют вид
ХТ(Х[п\
Щп\) t M
(853)
Приравнивая (8.5^) к нулю и решая сисіему уравнений, несложно получить:
-128-
'W
0006272
Рис. 8.1
-129-
2,8l
CO
і**
-131-
ЦвО.ОШІ
-0,5-
Рас. 8.4
.• -ф
41
Рис, 84
133-
(8,54)
Д[п] = Я[я - 1] - п(С[п - 11/ - î).
Вводя магрицу
размерности (/их/я) и применив рекуррентную форму обращения, получаем;
(8.56)
В результате процедч ра получения обобщенного прогноза задается следующей системой рекуррентных соотношений:
Ц-
X Т[п +
Недостатком данной процедуры является возможность вырождения матрицы Р[п] в процессе вычислений. Вероятность вырождвнш !J{n] особенно высока 8 случав линейной зависимосш (ыуяьти-коллинеарности) частных прогнозов, поэтому исполь.юпание процедуры (8.57) целесообразно в случае, когда прогиозир) емый про-i;cfcc аппроксимируемся системой линейно независимых функций и необходимо найти коэффициенты разложения,
Исм>дя кз вышеиеречиеиенного, наиболее п^ и эф-
шеноф решение задачи построения обобщенного -.<}и:иоза мо-быть получено с помощью ада;пітного «піуриіма (8,31), • аоцтверждае'гсй рвзульчатамн машинного мог*? шрования.
-134-
«все книги «к разделу «содержание Глав: 13 Главы: < 5. 6. 7. 8. 9. 10. 11. 12. 13.