ГЛАВА VI. ПРОГНОЗИРОВАНИЕ ВЗАИМОСВЯЗАННЫХ ПОКАЗАТЕЛЕЙ ПРЕСТУПНОСТИ
Преступность как социально-экономический процесс формируется под влиянием многочисленных и разнообразных факторов. Качественный анализ позволяет в каждом конкретном случае установить, капе именно факторы влияют на изменение состояния и динамики разви.ия преступности. При помощи количественного анализа устанавливается мера взаимосвязи этих факторов. Выявленные взаимосвязи выражаются в форме обобщенных математических моделей. Эти модели позволяют более четко организовать контроль за состоянием преступности, прогнозировать и контролировать динамику ее изменения, что в конечном итоге ведет к повышению эф-фекіивности работы оріаноа внутренних дел по предупреждению и борьбе с пресіупностью.
6.1. Обобщенные математические модели взаимосвязанных показателей
Обобщенные математические модели, будучи описанием реальных ситуаций, возникающих при изменении состояния и динамики развития преступности, в перечне своих переменных фиксируют потребность в данных для решения целого ряда задач и тем самым служат отправным пунктом при формировании программ контроля, анализа и прогнозирования преступности. В информационном аспекте модель является способом организации информации, средством фиксации логических и семантических зависимостей между параметрами.
Математические модели, применяемые для контроля, анализа » прогнозирования состояния преступности, должны отвечать ряду требований. Благодаря этим требованиям создается реальная возможность выделить из множества моделей те, которые могут иметь практическое значение.
Основное требование заключается в том, что модели должны адекватно отображать реальные взаимосвязи. Возможность использования модели зависит от того, насколько она по составу переменных и характеру соотношений между ними соответствует преступности, как объекту моделирования, и комплексу решаемых органами внутренних дел задач. Следует отметить также, что в шсле переменных не /должно быть таких, значение которых либо невозможно получить при помощи существующего учета, либо получение их при сущее Івующих условиях и заданных Іреоиваишіх к достоверно-
сти является слишком трудоемким. Естественно, что шбор модели для практического применения должен осуществляться с учетом требований как полноты отображения, так и минимума затрат на получение необходимых данных. На практике, как правило, отдают предпочтение простым моделям - к более сложным следует переходить только тогда, когда простая модель неадекватна либо применение более сложной модели приводит к повышению эффективности получаемого решения. Практическое применение моделей вызывает необходимость ограничения их размерности. Большой объем информации, сосредоточенный в рамках одной модели, делает эту модель труднообозрнмой и неприменимой для практических расчетов. Весьма важным направлением в приложении социально-экономических моделей является то, которое связано с прогнозированием. Прогнозирование с помощью моделей основывается на предположении, что связи, сдоживи иеся при формировании преступности в прошлом и имеющие место в настоящее время, сохраняются и в будущем. Таким образом, возможность использования "моделей для целей прогнозирования является своего рода критерием их устойчивости. Каковы же причины, заставляющие наряду с предикторами отдельных рядов использовать социально-экономические модели преступности? Дело в том, что преступность, как и любой социально-экономический объект, описывается системой показателен, которые тесно между собою связаны. В принципе, когда система показателей является независимой, можно надежно экстраполировать любой из них в отдельности. На практике же этой взаимосвязью пренебрегать нельзя ввиду того, что существующая мультикол-линеарность показаний не позволяет получить достаточно точные их оценки. Кроме того, как указывалось в [8], в ряде случаев предысторию процесса, который необходимо экстраполировать, невозможно проследить. Однако в распоряжении исследователя могут иметься данные о другом процессе, свягишом с первым функциональной или сташстической связью. Например, при контроле за изменением динамики преступности можно прогнозировать изменения какого-либо показателя, не прибегал к его непосредственному измерению, а исследуя данные о друюм показателе, связанном с первым. Это важно в тех случаях, когда часть показателей трудно измерима. Заметим также, что хотя задачи анализа и І.рогнозирова-ния преступности тесно связаны, при прогнозировании используется меньшее число показателей, чем при анализе [69], но так же, как и при анализе, на любое время должно достигаться наилучшее соотношение взаимосвязанных показателей.
-78-
Одним из основных типов моделей, применяемых при анализе зависимое ген показателей в социально-экономических системах, являются так называемые обобщенные модели. Цель построения таких моделей: количественно оценить, измерить характер и степень связи и влияния друг на друга показателей, характеризующих ход функционирования социально-экономической системы.
Следуя [89], под обобщенной математической моделью понимается экономико-математическое выражение зависимости результатов деятельности социально-экономической системы от обусловивших эти результаты показателей, а по [44] обобщенными моделями называют модели, описывающие зависимость между результатами функционирования социально-экономического объекта и показателями, характеризующими факторы, влияющие на это функционирование. В общем случае обобщенная модель имеет вид
где X - результирующий вектор показателей, G - вектор показателей влияющих факторов, Ф - матрица параметров. Часто не удается четко дифференцировать существующие показатели по результатам и затратам, так что деление на X и G a некоторой мере является условным. Заметим также, что в практических приложениях обычно используется обобщенная модель в виде одного уравнения, причем see компонента результатов объединены в одну скалярную величину, а число разнородных социально-экономических показателей сведено к минимуму, допускающему расчет параметров обобщенной модели на базе имеющейся информации
**/&.«*•-. вч). (6-2)
В анализе обобщенных моделей центральное место занимает мс-сдедовакие следующих характеристик: :
Ж
« средней зффектдайсюта/'ого фактора — ;
Se
» предельной эффективности 2-ого фактора, характеризующей
• ж
приращение отклика на едшицу приращения z-oro фактора
« характере изменения предельной эффективности, опредеден-
дгх
ного второй прокаводной — у ;
0&
* коэффициента эластичности, характеризующего относительное изменение отюшхе на единицу относительного изменения фак-
âx Ki тора .M.
79-
Основиыми направлениями применения обобщенных моделей являются 189]: контроль, прогнозирование, анализ, обоснование принимаемых решений, оптимальное планирование и управление, получение различных величин нормативного характера др, -Формально большинство обобщенных моделей относится к классу сга-Іиспіческих. моделей, исследуемых с помощью методов регресси-онної о и корреляционного анализа.
Обобщенные модели мої у г служить важным средством совер-шенсівования системы показателем, характеризующих оперативную обстановку, и системы показателей эффективности деятельности органов внутренних дел но предупреждению и борьбе с преступностью для определения того, насколько точно и полно отражает каждый из них показателей различные стропы развития преступности. С помощью обобщенных мотелей можно исследовать зависимость динамики изменения преступности і! друшх важнейших показателей деяіельносіи органов внутренних дел от наиболее глубоких и общих факторов, определяющих мноюобразными путями все важнейшие стороны социально-экономического развития государства. При помощи анализа раскрываются не индивидуальные особенности этих факторов в каждом отдельном случае, а их устойчивое влияние на развитие преступности. Методы корреляционного и регрессионного анализа, как основного математического аппарата моделей обобщенных показателей, дают возможность получить эмпирическую форму зависимости исследуемого отклика от прямо или косвенно определяющих его факторов и позволяют установить силу воздействия как всего комплекса факторов, так и каждою из них в отдельности.
Весьма перспективным представляется использование обобщенных моделей для решения задач оперативного контроля показателей, измерение которых связано со значительными трудностями. В этих случаях прямой контроль с успехом может быть заменен косвенными методами оценки при помощи функциональных статистических зависимостей, которые находят свое выражение в обобщенных моделях.
И, наконец, как уже отмечалось, важнейшим направлением в использовании обобщенных моделей является прогнозирование.
Как указывалось в [88}, "существенную роль играют обобщенные модели как инструмент прогнозирования конечных результатов функционирования социально-экономических систем, что дает возможность рассчитать прогнозируемые величины".
Необходимо еще раз подчеркнуть мысль, что в отличие от прогнозирования с помощью предикторов отдельных рядов, которое
-80-
основывается на предположении о сохранении тенденции развития Іїреступности во времени, прогнозирование с помощью обобщенных моделей взаимосвязанных показателей основывается на предположении сохранения сложившихся взаимосвязей, то есть на сохранении тенденции развития в пространстве. Это предположение позволяет выделить некоторые особенности прогнозирования на основе обобщенных моделей взаимосвязанных показателей. Здесь следует отметить многовариантность прогнозов, объясняющуюся возможностью придания независимым переменным различных значений, что позволяет выбрать наилучшие варианты развития. Отсюда, конечно не следует, что прогнозы, получаемые на основе обобщенных моделей, обязательно лучше "предикторных" прогнозов, однако их несомненным достоинством является возможность наглядного описаний сложившихся взаимосвязей и четкая взаимозависимость показателей, входящих в обобщенную модель. Заметим, однако, что, несмотря на возможность содержательной интерпрета-цли, обобщенные модели, тем не менее, являютсі математическими абстракциями. Точные качественные законы развития преступности во всей их полноте они отразить не способны, что естественно обусловливает невозможность безошибочного прогнозирования. Однако основная ошибка прогнозирования определяется не столько точностью получаемого уравнения, сколько тем, в какой мере надежно оценены будущие значения независимых переменных. Поэтому необходима дополнительная информация для уточнения ^наченкй независимых переменных. Это могут быть плановые значения, показатели другого прогноза, экспертные оценки показателей.
Возможность использования обобщенных моделей взаимосвязанных показателей для прогнозирования создает предпосылки дек решения задач оптимального планирования й управления. Как указывалось в [88], "Аппарат обобщенных моделей применяется также при обосновании оптимальных плановых решений. В качестве моделей оптимального планирования обобщенные модели взаимосвязанных показателей позволяют прежде всего определить максимально эффективные сочетания ресурсов и принятые показатели эффективности плана". *
Важное значение в процессе разработки обобщенных моделей уделяется прогнозированию показателей, характеризующих отдельные виды преступности, и социально-экономических показателей развития отдельных регионов. Такие обобщенные модели мог/г быть построены для преступности отдельного района, города, области. В этом случае переменные характеризуют количество совер-
-81-
шаемых. преступлений. Заметим, что именно такие обобщенные модели будут объектом дальнейшего рассмотрения.
По характеру входящих переменных различают статические и динамические обобщенные модели. В динамические модели входит время либо в явном виде, как независимая переменная, либо в неявном виде через авторегресеионные члены. В отличие от динамических, статические обобщенные модели включают в себя показатели, причинно обусловливающие то или иное значение прогнозируемого параметра. Поэтому именно такие модели весьма удобны для решения задач прогнозирования преступности.
По аналитическому виду обобщенные меіели можно разделить на:
1. Линейные обобщенные модели с раз шм числом входящих в
их состав факторов:
<?
* = УО+ 2>/gi » (6-3)
i=î
где параметры де выражают значения факторов g, , то есть показывают абсолютный прирост данного фактора, согди все факторы остаются неизменными, а один возрастает на единиц) .
2. Степенные функции Кобба- Дугласа:
• (6-4)
Ы
Здесь параметры у, выражают эластичность уровня преступности х по отношению к факторам gt . Например, для q=2 параметры до и ц/2 показывают относительный прирост числа совершаемых преступлений (в процентах), связанный с относительным приростом факторов
gl И g2-
3. Различные существенно нелинейные модели, среди которых наиболее известна функция с постоянной эластичностью замены:
1
5f 5. (б-5)
где параметр 5 выражает эластичность замены основных факторов.
Сразу же заметим, что предметом дальнейшего рассмотрения будет не анализ качественного характера обобщенных моделей, а методы их построения и, прежде всего, адаптивные процедуры. Преимущества адаптивного подхода вытекают из принципиальных недостатков прогнозирования преступности с помощью обобщенных моделей, построенных с применением методов регрессионного и корреляционного анализа. Это [18]: отсутствие падежных еташ-стических aâfvrftix, малые объемы выборок, недостаточные -:очно:, і ъ
и эластичность моделей, трудности с построениями многомерных уоделей, нарушение предпосылок регрессионного анализа н др. Большая часть затруднений, вызванных данными обстоятельствами, может быть продолжена применением адаптивного подхода. Конечно, данный подход обладает своими, присущими только ему недос-таїкамн. Это прежде всего [64] необходимость отказа от истолкования параметров обобщенной модели как структурных инвариантом, позволяющих делать качественные выводы. Данное обстоятельство ограничивает прогноз малым числом штатов за конец обучающей выборки. Поэтому основная область применения адаптивных обобщенных моделей - это краткосрочное прогнозирование, оперативный контроль, планирование и управление.
6.2. Построение обобщенных моделей с помощью метола наименьших квадратов
Основным математическим аппаратом построения обобщенных моделей является метод наименьших квадратов. Поскольку методу наименьших квадратов посвящено значительное количество монографий и статей, приведем краткую сводку основных результатов. Пусть обобщенная модель преступности записана в виде
" f S, (6.6;
ЕМ)7'.
(SOU)
Допустим сначала, что С » S статистически независимы. Вектор ошибки К можно определить как
У = Х-СУ, (6.7)
где У - оценка искомого вектора У*. В качестве функции ошибок (функции потерь, критерия идентификации) выбирает положительно определенную форму
Q*yTAy = \rfA, (6.8)
где А - матрица весовых коэффициентов а , t . Без потери общности мс кно предположить, что эта матрица симметрична. Тогда крите рий идентификации может быть записан в виде
-83-
Q = \X - Cwf. = (X - GM')r A(X - GT) = XTAX + (СУ)7 Л(СЧ') ~
Так как (GУ) = УС ,&А- симметрическая матрица, то
/}_ уТ лу > Ц/Т (~±Т ДГІШ _ -уш Т г;Т і у
\f _ у^ fU\ Т f V/ Л vy Г A*t vJ /1VX •
Дифференцирование этого выражения по У дает
^ = УдгО = 2GTАСУ-2GTАХ, аУ
Последнее выражение можно записать в в;'.де Отсюда находим У , обеспечивающее 3KCTpewM Q
=GTAX.
(6.9)
(6.10) (6,11)
(6.12) (6.13)
Это так называемая система нормальных уравнений. Если G AG -невырожденная матрица, то
Данная оценка является эффективной при выполнении некоторых условий, среди которых можпс выделить следующие: возмущения Я являются лормально распределенными случайными величинами с нулевым математическим ожиданием и постоянными дисперсиями, причем последовательность ошибок Не автокоррели-рована. В реальных условиях эта предпосылки зачастую нарушаются, что ведет к ухудшению качества получаемых опенок. Далее мы рассмотрим некоторые виды оценок, не зависящие от приведенных предположений.
Оценка (6.14) соответствует наиболее общему случаю, называемому обобщенным методом наименьших квадратов. В связи с этим возникает необходимость рассмотреть ряд некоторых наиболее часто употребляемых частных случаев.
6.2.1. Стандартный метод наименьших квадратов. При использовании этого метода минимизируется выражение
Таким образом, в уравнении (6.8) и вытекающих из него уравнениях г- единичная матрица. Тогда несложно получить:
Если G - квадратная матрица, т.е. если размер выборки равен числу оцениваемых параметров, и если матрица С имеет обратную, то
(GrGr1Gr = «F = <j"1 , (6.17)
откуда
Ч^-О~1Х. (6.18)
Необходимо заметить, что этот случай не представляет особого интереса, поскольку не учитывает случайных возмущений. В матрицу G в качестве независимого фактора можно ввести член, характеризующий время. Это может быть сделано введением линейного члена, который но мере надобности может дополня гься членами более высоких степеней. Введение времени в качестве независимой переменной позволит учесть влияние тех связанных со временем факторов, которые не введены в обобщенную модель, но мог) г оказывать влияние на конечный результат.
6.2.2, Марковские оценки. Предположим, что известна коварна ционная матрица аддитивною шума
(6.І9)
Тогда, при использовании марковских оценок минимизируется выражение
(6.20s
_
А
Следовательно,
A=R-'. Оісюда несложно получить
V-(GTR~1GT1GTR~{X .
В том случае, если аддитивная помеха Е- белый шум, т.е.
(6.21/ (6.22.»
R=M{SS} = al, (6.23;
то оценки метода наименьших квадратов (6.16) и марковские оцен ки {6.22} совпадаю г.
вЛ.З. Метод наименьшие квадратов для їшслеіадятельиосік u,4j по н-ниіі. В большинстве практических приложений постриг нас оГ.тпщеннон модели целесообрвзно яройодші. в процессе фор-мі!рйл-!,:іл Mdтематической модели преступности. '}Іу задачу реіпа-ю'ї мо І оды последовательной идентификации, ..-о особенное гя>
которой говорилось выше. Если записать уравнение (6.І4) относительно ошибок Кв виде
Л Пп] = У*М - П"} = (GT[n]AG[n]Tl СТ[п]А У[п], (6.24) несложно получить рекуррентную формулу уточнения коэффициентов:
Wn+\]*4ty] + (GT\n\AG[n]y}GT[n]A(X[n]-G[n№[n}) . (6.25) Здесь можно положить А - I и А - R'1 . Необходимость обращения матрицы на каждой итерадич усложняет численную реализацию процедуры и вносит дополнительные погрешности к вычисления. Это оостоячельство ограничивает применение алгоритма (6.25).
6.2.4. Рекуррентный меїод наименьших квадратов. Введем в рассмотрение матрицы
-,
ОД
. (6.26)
(6.27)
(6.28)
Здесь вектор g{n * ) ] соответствует новому наблюдению. Вводятся в рассмогрение матрицы
Используя известные матричные тождесгви, можно эагшсать:
"1
/» [я + П = Р [я] - Р Ш" + 1К«г[я + Ч/* 1иМ'« ^ Ч + 1)"1
-
где
является скаляром. Используя К> 14) запишем оцснкд и>>.)ф-фициешов
(6 30)
ц/ \п
[n + }\Gl'[n г \] Х\п + і | =
-86-
или
[n + l]x[n + l}). . (6.31) Подставив (6.29) в (6.31), получаем: Vf (п + 1J = Р [n}GT[n]X[n] + Р [n}g{n}y [п]/-1[п] Х[п + 1]-
- Р [n]gf« + \}Г М/[« + i](Gr[«№] + g[n + l]x[n + I]). (6,32) С учетом (6,30) перепишем (6.32) в виде:
+ ЧІФ + Ч - Л + J]r M).
(6.33)
Формулу (6.33) можно записать также в виде:
(6.34)
(6.35)
6.2.5, Рекуррентный обобщенный метод наименьшая квадратов, Непосредственно из приведенных выше результатов следует:
]= Pin]
Ф +
,6.36)
(6.37)
где ефгН] - соответствующий элемент диагональной матрицы А т функционала Q ~VTÂV, Весьма важным моментом является w6op начальных* условий рекуррентных процедур оценивания. Здесь можег быть использовано несколько приемов:
Ї.Если известно, что выходная последовательность g является стационарным белым шумом с дисперсией <%*, то можно выбрать
Я*}""-^ ' (6.38)
k<yg
и рекуррентная процедура начинается с (&+1)-ой итерации.
2. Использование k наблюдений для установления начальных
условий:
#*] = P[k}GT{K\Xikl P[k] = (GT[k]G[k]rl. (6.39)
3. Использование
P[Q] = at, (6.40)
где а - очень большое действительное число, а ^ [0] * выбирается произвольно.
-87-
6.2.6. Экспоненциально - взвешенный рекуррентный мегод наименьших квадратов. Во всех приведенных выше модифнка-циях полагалось, ч го вес каждого наблюдения не зависит от времени ею поступления. Ранее было показано, как можно по-давлять "устаревшую" информацию с помощью введения специально подобранной системы весов. В данном случае это можно выразить следующим образом:
Ст[п
= (a G[n}(a С[я]
\}g[n + 1], (6.41)
или
1], (6.42)
1]=
g(n + \}a~2gT(n
І- ,.*
где 0 < а < 1. При /?= и ' получаем следующие соотношения:
Р[п + \] = 0 ~\P[n]-y[n\P[n]g[i + l]g [n + \]P[n]), (6.44)
у [n] = (g [п + }]Р [n]g[n +1] +/J)~ . (6.45)
Весовые коэффициенты, приписываемые прошлым наблюдениям, изменяются как функции] по закону а *"^, j < п . т.е. осуществляется экспоненциальное взвешивание прошлых наблюдений.
6.2.?. Одиошаговый фильтр Калмана. В том случае, если известна дисперсия случайного шума а2, для уточнения оценок коэффициентов можно использовать так называемый одношаговый фильтр Калмана в дискретной форме [55]:
И»] + Р[» + Ы" -І- ibf
,(6-46)
г-. '
(647)
Можно отметить, что данный метод оптимален в смысле метода наименьших квадратов. При отличных от нормального распределениях получаемый фильтр является оптимальным в классе линейных фильтров.
6.2.8. Рекуррентный метод нанмекг.ггшя квадратен при коррелированных помехах. Данный метод основан на предварительном линейном преобразовании наблюдаемых последовательностей, которые далее используются л рекуррен еной процедуре МЛН для помех типа дискретного белого нл'ма. Анажнччни маркоьским оценкам запишем соотношения для и!Ии Нн+1];
GTM
'м'І»0 w* м*м. (6.48)
GT[n~
- \\ч/[п~l} = GT[n- \]R~l[n-\}X[n- I] .
(6.49) Матрица R[n] образуется окаймлением матрицы Л[и-1]
- -- — (6.50)
'пп /
Для блочного представления матрицы R[n] имеет место соотношение
к~ [я -1}+ — j ———
а[п] а{п]
îj-I] _1_
ф]
(6.52)
где о^п}-гпп ~r [n~l]R~\n-l]f[n-l]. Можно также показать,
что Р~1[п] = Р~1[п-1] + е[п1еТ[п], (6.53)
С учетом этих соотношений искомые оценки коэффициентов
1
можно записать в виде:
ІФІ1 - w{n -1] + Р[пЩп№я] ~ е1 М»Ф> - Ч) ,
(6.54)
(6.55)
где
ф] - ^г[н - Цй"1!" - ЧФ» -1] • Полученные соотношения составляют адторитм получения оценок коэффициентов обобщенной модели при коррелированных помехах, который отличается от Стандартной рекуррентной формы
тем, что б данном алгоритме вместо измерений х[п] и g[«] функционируют преобразованные величины х{и] и g[nj. Эти величины являются линейными комбинациями от наблюдений х[п] и g[n], причем центрированная составляющая процесса х[п] - преобразованная помеха - является дискретным белым шумом. Использование соотношений (6.54), (6.55) позволяет преодолеть одно из затруднений регрессионного анализа, связанное с требованием некоррелированности помех.
6.2.9. Метод Бйкся-Дженкинса. Модели типа (6.6) не отражают динамику развития преступности. Это < -граничиваег область их применения, тчк как взаимосвязи, устанаг, «геаемые этими моделями, могут быть исследованы только в фикс руемый момент време-
ни. В то же время весьма важными являются задачи исследования взаимосвязей показателей в зависимости от предшествующих событий (лаги) и в будущие моменш времена (прогнозы). Исследование этих вопросов может быть осущепшено с помощью динамических обобщенных моделей. Чтобы построить динамическую модель необходим предварительный . одпю времен* . Ішх рядов, характеризующих рассматриваемые показатели. Как правило, на практике с достаточной точностью удавгея опи-"ш. динямическче объркты линейным фильтфом:
х[п}-= У08ІХІ + V\Sl»~ 4+ ¥2&»-ty • '•-•
= (<ff с -Ь УІ8 + ViB* +-М")* W(*)«l«l. С6-56)
где ^ j -' весовые коэффициенты при orsepaTOpe сдвига назад 'на і шагов В'. При построении динамических обобщенных моделей исходной информацией служат нестационарные временные ряды показателей, С целью исключения неетационарности удобнее оперировать не с самими исходными выборками х[п] и g[n], a с их разновидностями ах[п\ и 4g(n}. Можно показать, что
ЛхИ]=^(В).4я[л], (6,57)
т.е. разности Дх\п\ и 4g[«] удовлетворяют тому же соотношению, что и исходные ряды
Важным вопросом при построение дайамкмееков обобщенной модели является вопрос об ее устойчивости. Ф/шщия ус
тойчива, если ряд у/о + (^jB+ р^Вт-К,. сходится при 'Г ; намическая обобщенная модель может быть представ. >• а в ï соотношения
(6.5К,
или в сжатой форме S
-90-
Несложно показать, что у/ (В) = S~ (B)w(B). (6.60)
Таким образом, динамическая передаточная функция в общем виде может быть записана как
х[п] = Ô~ (B)\v(B)g[n- k] + £[n]. (6.61 )
При этом Дж. Бокс и Г. Дженкинс указывают, что в практически* ситуациях при заметном уровне шума недостаточный объем данных не позполяет использовать более сложные структуры, чем модель первого или второго порядка, а эффективное оценивание коэффициентов возможно только в предположении, что струкіура модели известна.
Рассмотрим процесс построения динамической обобщенной модели, включающей коэффициенты хищений, совершенных путем кражи (*]) и хищений, совершенных путем растра І ы (xj) в г. Харькове (см. рис. 4.З.), Выше были идентифицированы временные последовательности, характеризующие динамику этих показа гелей, с помощью обобщенного оператора авторегрессии, т.е.
" *М = &М, «^
>*[«] = &[nj, (6.63)
Процесс построения динамической обобщенной модели складывается из следующих этапов:
Идентификация временных последовательностей х[п] и #[/?}.
Исключение среднего значения из вторых разностей времен
ных последовательностей
*Di} = J'*[«]-J а- , (/Гл: = 0.008). (6.64)
3. Выравнивание спектра рядов х[п] и ц[п]
IM = §[»] - vig[n ~П- Угеї» ~ 2J, (6.65)
х[п]-х[п]~ ^'І?[и -1] - !//2*ф» - 2], (6.66)
V/, - 0.682, ifc = 0.504. (6.67)
4. Расчет взаимной корреляционной функции выравненных вхо
да и выхода
г (ъ\пл Щп\\
•'-• , (6.68)
j •
-91-
(6.70)
Tfw
o|m= 0.134 , оздо» 0.0521, (6.71)
p - порядок авторегрессии, d - порядок взятия разностей. Для рассматриваемых последовательностей взаимно-корреляционная функ-1 ция приведена на рис. 6.1.
5. Расчет функции откликов на единичный импульс
ц,. =
(6.72)
(вид этой функции приведен на рис. 6.2.).
6. Определение порядка р и q лево- и нрпвостороннеї о оператора динамической обобщенной модели. По виду функции отклика на единичный импульс можно сделать некоторые выводы. Веса До) и 1/ъ изменяются произвольно. Начиная с веса де>, функциг отклика на единичный импульс знакопереыенно затухает. Исходя из этого, можно сделать вывод о том, что p=q=2. И: ж, можно принять гипотезу о том, что связь между переменными "|f!«J к х[п] выражается оператором
' Ш- (6.73)
7, Нахождение значений 5% щ, щ, 0\, <%. Величины Si и ходятся путем решения матричного уравнения вида
НО - h,
на-
где
О, q +
(6.75)
Элементы этих матриц могут быть представлены как Нц-^2,
Я12=Гь Нг\=Щ, Я22=^, ^=^3» Л2=Г4-
Решение (6.74) позволяет найти искомые коэффициенты <5i=Q.741, (%=0.813. Коэффициенты щ находятся согласно выра-жешшм
= = -0.434-1 0"1
•- 0.41910*V
І=1 , =-1.546-10"1.
..II
0,00!БІ
0,0001-
•О.ОХИ-
-92-
Рис. 6.1
Рис. 6.2.
-93-
Полученные значения коэффициентов а и w являются весьма грубыми и могут служить лишь начальными оценками для более эффективной процедуры оценивания. Процедура, использовавшаяся Боксом н Дженкннсом, достаточно сложна и требует больших за-трат маишиного времени, поэтому здесь более эффективными оказываются адаптивные процедуры, рассматриваемые ниже. Заметим также, что коэффициенты а и w , являются функциями весов у,, коюрые в свою очередь однозначно опредедяюіся через величины аъ, а~ н г ,(g,x ). Это обстоятельство может служить основой для
* &
организации процедуры контроля за структурой обобщенной модели, аналогичной процедуре контроля, изложенной ранее,
6.3. Структурная идентификации параметров модели
Как можно убедиться, наиболее трудоемким процессом при построении обобщенных моделей пресі\шюсти по Боксу-Дженкинсу является структурная идентификация модели преступноеги. Заметим также, чіо в настоящее время задачи структурной идентификации решаются в большинстве случаев на эвристическом уровне, что требует высокой теоретической подготовки и опыта решения практических задач у исследователя. Использование ЭВМ для рішення такого рода задач ограничивается интерактивным режимом, причем окончательное решение принимает человек, что вносит значительный элемент субъективизма в конечный результат. Полная автоматизация процесса структурной идентификации хотя и наталкивается на существенные трудности, представляется весьма аривлекатель-. ной. Один из возможных путей решепш: этой проблемы состоит в многократном решении задачи параметрической идентификации для множества возможных структур и выборе наилучшей hj моделей, однако, здесь результаты моїуг существенно отличаться в шви-симости от применимых критериев идентификации и конкретных вычислительных процедур. Альтернативный подход к решению этой проблемы состоит в использовании метода, основании» о на теории распознавания образо». При этом предполагается, что ІЧ'раз, соответствующий конкретной структуре, занимает конечны'< « Гтьем в пространстве признаков, образованных козффициеі шмті аыо- и взаимокорреляциоиных функций. Сущность подхода covK > І о нахождении соответствующего разбиения пространства признаков на основе информации, содержащейся в образах с известной классификацией. Разделяющие поверхности, иострознные с использованием
94-
этих данных, используюгся в дальнейшем для классификаиии образов с неизвестной принадлежностью.
Рассмотрим последовательность этапов, связанных с решением задачи структурной идентификации. Пусть обобщенная модель задана выражением (6.61), тогда процесс идентификации состоит из: » определения порядка взятия разностей, необходимого для приведения процессов к стационарным;
в определения структуры фильтра для выравнивания входных и выходных последовательностей (определения структуры процесса на входе);
огфеделения чистого времени задержки между входным и выход
ным рядами;
определения порядка номиналов о(5) и и'(£);
» определения структуры модели случайного шума S.
Решение данных задач может быть проведено с помощью некоторой системы распознания образов (она может быть запрограммирована на ЭВМ), состоящей, как минимум, из трех основных подсистем: преобразователя, селектора признаков и классификатора. Функция преобразователя состоит в трансформации входного образа (лоследователыюстей g[n], x[n]~) в вектор признаков. Селектор признаков т^ечздовательно выделяет га этого вектора признаки, существенные для построения разделяющих поверхностей. Конкретное решение о прі Іадлежности образа на основе информации, содержащейся в векторе признаков, применяется последней подсистемой - классификатором,
Вектор образов формируется из коэффициентов авто- и частньж автокорреляционных функций входных и выходных последовательностей и из коэффициентов взаимокорреляционной функции. Существенные признаки выделяют го этого вектора с помощью эвристи» ческих или математических процедур. Эвристические процедуры базируются на знании отношений между образами и классами, в то время как математические методы базируются на оптимизации некоторого формального критерия разделимости классов. Классификация признаков представляет собой обучающуюся адаптивную систему, причем предполагается существование разделяющей поверхности между классами в пространстве признаков, Основная задача, решаемая классификатором, состоит в нахождении неизвестных параметров этой поверхности.
Разработка конкретной распознающей системы основывается, как правило, на обучающей выборке образов с известной классификацией. Процесс обучения при этом рассматривается как разработка объективных решающих правил на основе информации, содержа-
-93-
щейся в обучающей выборке, с помощью тех или иных математических средств. Заметим, однако, что хорошо определенного формально решающего правила самого по себе недостаточно для объективной структурной идентификации, поскольку надежность этих правил определяется надежностью классификации по обучающей выборке. Таким образом, для того, чтобы исключить элемент субъективизма из процесса проектирования распознающей системы, обучающая выборка должна генерироваться имитационной моделью, струкгура которой известна :очно.
Первый и третий этапы решения задачи структурной идентификации при таком подходе очень просты. В частности, подсистема, определяющая необходимый порядок взятия разностей для приведения исходных процессов к стационарным представляет собой простейший двухклассовый идентификатор, который определяет стационарность либо нестационарно^ть предъявляемых последовательностей. При этом стационарность определяем с помощью ав-то- и взанмокорреляционной функции по Яглому либо по чнакооп-ределениости магрицы Лорана [14, 2І}. Если предъявляемые ряды нестационарны, то они дифференцируются н соответствующие коэффициенты корреляции опять-предъявляются классификатору для проверки на стационарность. Этот процесс повторяется до тех пор, пока ряды не будут признаны стационарными.
Третий этап, на котором определяется задержка между входом и выходом, реали Іуегся с помощью простейшей пороговой функции. Задержка определяется номером первого коэффициента взаимной корреляции, который превышает заданный порог. Как правило, эти этапы реализукнся довольно просто и отличаются высокой надежностью решения.
Значительно более сложная проблема заключается в разработке решающего правила для решения задач идентификации выравнивающего фильтра (этап 2), передаточной функции (этап 4), модели аддитивного шума (^тап 5). Хотя задачи, рассматриваемые на этих этапах, имеют различное качественное содержание, решены они могут быть но однотипным вычислительным схемам. Данные схемы реализуют процедуры построения разделяющих гиперповерхностей для конечного множества классов. Казалось бы, что з, дача определения множества возможных стр>ктур имеет бесчисленное количество решений, однако, как указывают Дж Бокс и Г.Джеикинс, в стохастических моделях порядок авгорегрессии и скользящего среднего практически не превьішаеі числа три. Таким образом, все возможные сфукгуры образуют 15 различных классов. Вектор образов
-96-
Z, как уже указывалось, образуется коэффициентами авто- и частной автокорреляционной функции, т.е.
2-(г„г2 ..... ъ.Фн.Фь ..... Фл)т , (6.78)
Предположение о линейной разделимости классов сводит задачу распознавания образов к задаче определения коэффициентов, задающих гиперплоскость С і, і ~ 1,2, ...,15;
CV-/^^.,./, (6.79)
удовлетворяющих для любого Z из 1-ого класса условию
C,rZ>C/Z, V/*i. (6.80)
Эта задача с вычислительной точки зрения не представляет никаких трудностей, основная же проблема здесь - это формирование обучающих выборок для всех пятнадцати классов, что требует зна-
чительных затрат времени и средств,
6.4. Адаптивные алгоритмы построения обобщенных моделей
В основе адаптивных алгоритмов построения обобщенных мо-
делей вида (6.6) лежат вероятностные итеративные процедуры, ук~
льдыгозощиес" з
V M - ¥ [я - П ~ Г MV r Q(gtn},y [я - 13) . (6.8 1)
Здесь будут рассмотрены методы построения линейных обобщенных моделей, лабо нелинейных, приводимы.; путем некоторого преобразования к линейным. Так, например, широко применяемая функция Кобба- Дугласа путем логарифмирования приводится к линейной,
Известно [24], что в общем случае алгоритм адаптации могут рассматриваться в вице цифрового фильтра со случайными параметрами, преобразующего иеизвестшле параметры протво'Дствен-ной фунюрш 'цг * в их оценки iff. На практике наибольшее распространение подучил оптимальгшй одношаговый алгоритм (алгоритм Качмажа), который после рада шагов уточнения псзвотает получить оценки y/t сколь утйдио мало отличающиеся от вектора истинных параметров у ", Заметим, что приведенное в [50] построение адаптивной модели функции Кооба- Дугласа было осуществлено именно с помощью алгоритма Качмажа.
Дію п-то момента времени представим (6.6) в виде
/ГеМ (6-82)
-97-
а соответствующую адаптивную модель -
(6.83)
Алгоритм Качмажа может быть получен непосредственно из (6.81) путем максимизации выражения
по Г[п]> где в[ і ]= у*- у, Г{п]=у[п]1,1- единичная матрица (q*q), y [и] - скаляр. Уточнение коэффициентов производится согласно рекуррентной процедуре
"'gM (6.85)
g i»\8W
втом случае, если векторg[«] не коллімеарен вектору g[«-l]. В общем случае необходимо чередование в<~ входном воздействии по крайней мере q линейно независимых вектс^эв. Для уменьшения влияния шума в (6.85) может быть введен некоторый положи тельный параметр, при этом алгоритм приобретает вид
}-ГГ{я-Щ«]
(6.86) .
В том случае, если статистические характеристики шумов априорно известны, нетрудно вычислить оптимальное значение у, если же этой информации нет, эту величину подбирают экспериментально, исходя из того, что 0 й у S q . Причем, чем ниже уровень
помех, тем меньше значение y следует выбирать.
Как известно, фадиентные методы, к которым относится алгоритм Качмажа, позволяю! уверенно отыскивать экстремум в том случае, когда поверхности уровня функции & являются гиперсферами, либо близки к ним. В случае, когда поверхности уровня являются оврагами, а это бывает, если элементы вектора ^значительно отличаются друг от друга по абсолютной величине, скорость сходимости алгоритма (6.86) может замедлиться. Для ускорения сходимости алгоритм настройки коэффициентов должен осуществлять преобразование гиперэллипсоидов поверхности 0 в гиперсферы. В [93] в качестве такого преобразования рекомендуется в алгоритм настройки ввести матрицу Г [п] вместо скаляра у [и]. При этом в процессе настройки смещение по каждой из координат различно, что в ряде случаев позволяет увели-
-98-
чить скорость процесса идентификации. Без потери общности примем матрицу-Г[п] диагональной, т.е.
о
оч
(6.87)
Запишем (6.81) в виде
V М= у[п~Ц + Г [«МЯК*~ ¥Т(п~~ ! Такую форму градиентный алгоритм принимает при минимизации квадратичного критерия
Запишем (6.88) относительно ошибок идентификации
или
(6.89) (6.90)
(6.91)
где М»3 = £М£ГМ- Д™ нахозвдеяия оптимального значення G[n]. введем критерий, вредяожедашй в ( №)*]. Тогда можно записать:
в [пфг{и}= (в \n-\\-Г (п]М[п]в (п-1}) =
* (в (п - 1J- Г f»JM»F f" - ШГ.
4- У*4 \rt\K/f\ti\P$п 11 А*/ С**1 f""*'f*tî /Л О*7\
В качестве критерия скорости сходимости будем использовать выражение
(6.93)
Этот критерий идейно близок к критерию А - опти-мрчьности [90J. Применение критерия (6.93) позроляєт получить ряд алгоритмов адаптации. Дяя простейшего случая, когда Г[п]-у
& [п] * ТгР[п] ~ ТгР[п - 1] - ТгР[п - 1] Мт[п}Г т[п] -Ъ-Г [п]М[п}Р[І}-1]+ТгГ[п]М[п}Р[п-1}Мт[п]Гт[п]. (6.94)
-99-
алгорнтм приобретает вид
в [п] = ТгР [п - 1] - у (п]ТгР[п - 1}Мт(п] -- у {п}ТгЩп]Р [п -1] + у 2(п]ТгМ[п]Р [п - ЦМт[п]. (6.95) Воспользовавшись тем, что
Тг(АВ)« ЩВА);ТгА = ТгАт;Щп}~ Мт[п];Р [я}= />r[wj ,(6,96) и дифференцируя (6.95) по у[п], получим уравнение для нахождения у\п\:
аТгР{"1 = -Тг р [л - 1JМт[п] - Тг Щп]Р {п - !} +
+ 2y {n}Tr Щп]Р [n - \}MTîtl=0. (6.97)
Решение этого уравнения относительно у[п> позволяет получить: . _ ТгМ[п]Р[п-Ц
Тм Х^Т>*1 JD Г» _ 11 1^?*Гм-
к—гГТТ^ («•»)
что совпадает с алгоритмом Качмажа,
Рассмотрим случай, когда Г[п} является днагйигапъной матрицей. Тогда
Решая систему уравнений
(6.ІО)
получаем
(6.101)
где ( •) диагональные элементы соответствующнх матриц, *=1Д,,..^г. Матрица I* [я] ка каждом шаге может быть получена из (6.92):
Р [п] » Р {я - !} - Р [и - 1]Лф}ГМ - Г[п\Щп}Р [п -1] +
+ Г1п\М[п}Р[п-ЦЩп}Г[п1 (6.102)
Процесс идентификации с помощью рассмотренных алгоритмов иллюстрируется следующими примерами: 1. Моделировался объект
-100
на вход которого подается вектор, состоящий из нормально распределенных импульсов с нулевым математическим ожиданием и единичной дисперсией. На рис. 6.3 показан процесс настройки коэффициентов модели: сплошные линии соответствует настройке при помощи алгоритма с раздельной настройкой коэффициентов, пунктирные - при помощи алгоритма Качмажа. 2. Моделировался объект
Ф1 = g iM+10ft[fil+100ft[«]+1000g4[«J. (6-104)
условия эксперимента те же. На рис. 6.4 приведены графики настройки коэффициентов при факторах gt и ga. Аналогично рассматриваются и коэффициенты при £з и g,). Заметим, что алгоритм Кач мажа в данном случае вообще не обеспечил сходимосш.
Наряду с использованием одношаговых алгоритмов і» ряде сл> чаев целесообразно применение многошаговых процедур, обладающих лучшими сглаживающими свойствами.
Рассмотрим процесс синтеза многошагового алгоритма по критерию
е*£а><ф~Я^{я-1М«~Л)г- (6.105)
I*
Тогда процедура настройки коэффициентов может быть записана в виде:
И«1 = И« - Ч - 2r[»lt<*J (Ф - Л Vl" - № - Шп - Л
(6.106]
иди
(6.107)
Рассуждая аналогично предыдущему, несложно получить:
г.s
S в ? a S 10 11 12 13 14 IS 1C 17 16 19
•0,8
Рис. 6.3.
*-л
.(6Л08)
j.e
Работу шиоритма (6Д08) проиллюстрируем следующими примерами:
1. Моделировался показатель, характеризующий общее число
преступлений, зарегистрированных в Украйно в период е '97і но
1996 п.
Парамегр а принимал чнлнени» 0,3ц 0.6; 0.9. На рис. *-• v 6,7 показаны процессы изменения факпгческого и моделы-ых ь.. юв.
2. Моделировался шшштсдь хар^исгсрцзующий обик-с ••*<'«>
пресіуплений, зарегистрированных в І. Харькове в период с jv , но
1997 г г .условия эксперимента те же.
Процесс идентификации иллдострируется рисунками 6 8 - 6.Ш.
-102-
10
Рис. 6.4,
71747»T»r7Tt7tHt1f2*}MHM«7MMM»intt»«MM
-«-Фактический выход -л-Модельный выход
Рис. 6.5.
7S 74 7» 7* 77 7» 7» Ю »1 « Ю *4 И И 87 *р M » »1 «а « »4 H !№
—•— Фактический выход —*—Модальный выход
Рис. 6.6.
-104-
га т* те та ут та re so si 82 es &s ее и в? ее w so « и es *4 es ss
—«—Фактический выход —ér-Модельный выход
Рис. 6.7.
«ОДО
36600
шоо
«вео
sseo
72 7$ 74 78 IS Tt П 19 80 81 82 83 84 86 вв 87 № S9 9в 91 82 S3 94 8S К в7
--«—Фюсгачеекяй выход -йг-Модепъный выход
Рис. 6.8.
W600
« ТІ 74 7» 7* П П П M H *1П И И M «7 M П «О И И «S ** H M »7
—•— Фактический выход -*-Модельныь .лыход
Рис. 6.9.
60600
имев
1600
72 7Э 74 П П 77 7» 79 «О 81 82 Ю 84 It M 87 tt 8» »в 91 « «З «4 tS 88 9Î
-^-Фактический выход -т*-Модельный выход
Рис. 6.ІО.
-106-
В настоящем алгоритме регулирование влияния предыстории осуществляется непрерывно путем варьирования параметра а в диапазоне [0; I]. Наряду с |*епрерывным регулированием можно использовать дискретное, когда на текущее значение оценки влияет ограниченный объем данных. К таким процедурам относится, например, текущий метод наименьших квадратов, когда оценки определяются согласно выражению
ІМУ
= 1,2,3,...,?,
(6.109)
где M[n]=g[n]gT[n], a М,{п] получается из Щп} заменой ;-го столбца столбцом (gi[n]x[n},..., g<,[n]x[n}f.
И, наконец, можно применять комбинированное регулирование, когда оценки вычисляются по формуле [29]:
-
(6.110)
где / - единичная матрица, / , - матрица, которая получается из единичной заменой в ней і-го столбца столбцом ^{и-1 J. Этот алгоритм отличается тем, что позволяет уточнять коэффициенты математической модели обобщенного показателя в том случае, когда число экспериментов меньше числа учитываемых в модели факторов.
Рассмотренные алгоритмы получены в предположении, что статистические характеристики шума неизвестны и в явном виде не входят в алгоритмы настройки параметров обобщенной модели. На практике же зачастую предполагается, что в нашем распоряжении имеется, как минимум, дисперсия случайного шума cf/, которая в явном виде учитывается в формулах определения коэффициентов. В этом случае обобщенная модель задается не моделью (6.82), а выражением
Ф)=г'гяМ+1(«], (6.І И)
M
Лг-з г"*
f
(6.112)
І і. t, ^ііоритмах типа (6.88) оетимальные значения магрицы Г Іфиооретают следующий вид [109J:
-107-
Tr M(n]P [n]
Tr M[n]( Tr Щп]Р [a] -t- <тІ ) ' P [n + 1} = P [n] - y Ж Щ»]Р la] + P ln}M[n]) +
(6.113)
(6Л14)
-для
П»}=
(r,M о ^
0
(M[n}P[n])ti
—-, (6Л15)
F [и +1] = P [n\ - (Г'[п]Щ.п}Р [я] + P [п]М[п}Г'{п]) +
+ (Tr M[n]P [n] + cri )Г'{и}Аф,}Г *{>] ; (6.116)
- для Г[п] = (гл[п]), i,k = 1Д,...,д:
РГ»1
(6.117)
J=/>r«}~r>]MMP[ii), (6ЛІ8)
что соответствует одношаговому фильтру Калмаяа-Мейна. 1 В заключение отметим, что алгоритм (6ЛВ)-(6Л 14) соответствует алгоритму (6.85), алгоритм (6.115Н6ЛІ6) -алгоритму (6Л01Н6.102) и, наконец, (6Л 17)-(6.118) - процедуре рекуррентных наименьших квадратов. Выбор же конкретного адаптивного алгоритма построения обобщенной модели в конечном итоге определяется объемом априорной информации о показателях состояния и динамики развития преступности и требуемой точностью получения оценок.
-108-
«все книги «к разделу «содержание Глав: 13 Главы: < 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.