§ 7. Анализ вариационных рядов
С вариационными рядами мы встречались при обосновании выборочного наблюдения, изучении структурных и вариационных группировок, относительных и средних величин. К ним мы вынуждены будем обращаться и в последующих темах. Из предыдущего мы знаем, что вариационный ряд представляет собой группировку по одному признаку и с единственным показателем в сказуемом – меняющимся числом единиц совокупности, выраженных в абсолютных или относительных величинах.
276
Таблица 10 Распределение преступлений по возрасту субъектов
Возраст, лет
До 15
16-20
21-25
26-30
31-35
36-40
41-45
46-50
51-60
Преступления, %
3
11
22
26
19
10
5
3
1
Обратимся к общеизвестному вариационному ряду -- распределению преступлений по возрасту их субъектов. Примером может служить табл. 10 с усредненными показателями для многих стран.
Представленный в табл. 10 интервальный вариационный ряд отражает вполне определенную связь между варьирующим возрастом и изменением частот (процентами лиц, совершивших преступления). По данным мировой, российской и региональной статистики наблюдается практически одна и та же тенденция распределения правонарушителей по возрасту: с начала возраста уголовной ответственности идет рост преступной активности, в 25–30 лет (с некоторыми колебаниями) ее уровень достигает апогея, а затем наступает постепенное снижение'. В этом проявляется определенная закономерность изменения частот в вариационных рядах, называемая закономерностью распределения, которая выявляется в больших совокупностях, где случайные отклонения взаимоуничтожаются.
, В выявлении реальных закономерностей распределения заключается основная суть анализа вариационных рядов. Все вариации, подчиняясь своей в основе указанной закономерности, имеют много типов особенностей (отклонений), каждая из которых связана с теми или иными причинами, установление которых играет важную роль в статистическом анализе.
Обстоятельства, определяющие тип закономерностей распределения, изучаются на основе качественного (криминологического, уголовно-правового, уголовно-процессуального, административно-правового, гражданско-правового и т.д.) анализа сути того или иного явления, а именно – тех его свойств и условий, которые определяют изменчивость варьирующего
1 См., например: Личность преступника. М,, 1975. С. 121; Гернет М.Н. Избранные произведения. М., 1974. С. 522-524; Фокс В. Введение в криминологию: Пер. с англ. М., 1980. С. 222-223; Uniform Crime Reports for the Unites States. 1995. Wash. D.C., 1996. P. 16.
277
признака. Но к такому изучению приводит лишь выявленный тип закономерностей рядов распределения.
Обратимся к данным табл. 10. Удельный вес преступников с увеличением их возраста растет (прямая зависимость), но, достигнув какого-то уровня, несмотря на продолжающееся увеличение возраста, снижается до минимума (обратная зависимость). Однако максимум удельного веса (мода) находится не посредине ряда (интервал 31–35 лет), а сдвинут к более молодому возрасту (26–30 лет). Близко к моде располагается доля 21–25 лет и только потом идет 31–35 лет.
Такой сдвиг к молодому возрасту неслучаен. На качественном уровне криминологического анализа давно установлено, что лица молодежного возраста, не имея необходимого жизненного опыта и устойчивых позитивных ориентации, попав в сложные жизненные ситуации, вступают в конфликт с законом чаще, чем люди более зрелого возраста. Это связано, с одной стороны, с недостаточным уровнем их социальной зрелости, с другой -со сложностью возрастной ситуации (ослабление прежнего социального контроля со стороны семьи, школы, старших; переход к самостоятельности; физическое достижение взрослости; рост материальных и физических потребностей; необходимость самообеспечения, определения в жизни и т. д.), к правильному решению которой они чаше всего не готовы. Следовательно, объяснение этого традиционного сдвига лежит не в физиологических, а социальных особенностях возрастного характера.
Приведенные объяснения лежат за пределами юридической статистики, но к ним трудно прийти на основе только логических умозаключений, даже в данном несложном вопросе. Для этого надо выявить особенности реального статистического распределения значений признака. Чтобы зафиксировать характер имеющихся отклонений, надо сопоставить реальное распределение с каким-то его эталоном. Такой эталон – теоретическая кривая распределения, которая выражает общую закономерность распределения, исключающего влияние случайных факторов. Эта кривая распределения называется кривой Лапласа–Гаусса, или нормальным распределением. В качестве эталона используются также распределение Пуассона и некоторые другие, но они практически не применяются юридической статистикой.
Учитывая, что общая характеристика нормального распределения относительно полно рассматривалась в главе о выбо-
278
рочном наблюдении, в данном параграфе будут изложены лишь его особенности, необходимые для сравнительного анализа вариационных рядов.
Нормальное распределение выражается сложной формулой
где Р – кривая нормального распределения; х – варианты; х – средняя арифметическая вариант; о – среднее квадратическое отклонение; е и л – математические постоянные: е = 2,7182 и к = 3,1415.
В конечном итоге кривая нормального распределения зависит только от двух параметров: средней арифметической (х) и среднего квадратического распределения (о). От их значений зависит расположение центра распределения кривой на оси х и различия вариантов около этого центра (рис. 1 и 2), а также определенные асимметрии левой и правой ветвей относительно центра (рис. 3 и 4).
Рис.2
х > Mo
х < Mo
Рис.3
Рис.4
279
В нормальном распределении левая и правая ветви кривой симметричны, а средняя арифметическая, мода и медиана равны. Однако при соблюдении этого равенства кривые могут существенно различаться между собой.
Если средняя арифметическая величина (х) небольшая, то кривая располагается ближе к оси ординат (У), если – большая, то кривая сдвинута вправо от оси Рх (рис. 1, кривые 1 и 2).
Если среднее квадратическое отклонение (о) большое, то кривая распределения является высоковершинной (рис. 2, кривая I), что свидетельствует о скоплении частот в середине, о типичности и надежности средней. Такое положение в статистике называют положительным эксцессом.
Если среднее квадратическое отклонение небольшое, то кривая распределения является низковершинной (рис. 2, кривая 2), что свидетельствует о значительной разбросанности частот ряда и недостаточной надежности средней. В статистике указанные особенности называют отрицательным эксцессом.
Нормальное распределение симметрично по отношению к средней арифметической величине (х). Однако симметричных реальных распределений намного меньше, чем асимметричных. В асимметричном распределении средняя арифметическая, мода и медиана не совпадают, и их отклонения друг от друга измеряются с помощью коэффициента асимметрии (КА), который рассчитывается по следующей формуле:
где КА – коэффициент асимметрии; х – средняя арифметическая; Мо – мода; а – среднее квадратическое отклонение.
Суть перечисленных параметров нам известна. Из их соотношения в формуле следует:
если средняя арифметическая больше моды (Г > Мо), то коэффициент асимметрии положительный, и это означает правостороннюю асимметрию, т. е. правая часть кривой оказывается длиннее левой (рис. 3);
если средняя арифметическая меньше моды (Г < Мо), то коэффициент асимметрии будет со знаком минус (отрицательный), что означает левостороннюю асимметрию, т. е. левая часть кривой длиннее правой (рис. 4).
Вспомним наш пример (см. табл. 10), в котором наибольшая частота совершаемых преступлений падает на интервал 26–30 лет,
280
а не на средний интервал (31-35 лет). Из этого можно предположить, что мы имеем дело с отрицательным коэффициентом асимметрии.
Модальный интервал в примере равен 26-30 годам, которому соответствует 26%-ная частота совершения преступлений. Модальная величина (Мо) в модальном интервале рассчитывается по известной нам формуле
Мо =*,,+»-
/Мо ~ /1
где Ха = 26 лет (минимальная граница модального интервала); i = 5 лет (величина модального интервала); /Мо = 26 (частота модального интервала);/, = 22 года (частота интервала, предшествующая модальному);^ = 19 (частота интервала его следующего за модальным).
При приведенных данных имеем:
Величина *арифм = 28,97 года (порядок расчета средней арифметической интервального ряда изложен в § 3 настоящей главы). Напомним лишь основные действия расчета: вначале определяется середина каждого интервала путем сложения двух его границ и деления полученной суммы на два (например, (26+30) : 2=28); затем середину каждого интервала умножаем на его частоту (28 • 26 преступлений = 728); после этого полученные произведения складываем (общая сумма произведений середины интервалов на частоту равна 2897); разделив эту сумму (2897) на общую сумму частот (100), мы получим среднюю арифметическую, равную 28,97 года.
Это означает, что средняя арифметическая больше моды С* > Мо или 28,97 > 27,5), т. е. мы имеем дело с правосторонней асимметрией и положительным коэффициентом асимметрии. Для расчета КА необходимо знать среднее квадратическое отклонение. Найдем его из табл. 11.
Таким образом,
о =
КА =
-\2
Зс-Мо _ 28,97-27,5 _ +1,47
13,8
13,8
= +0,1.
281
Таблица 11
Расчет среднего арифметического отклонения
Возраст лиц (х), лет
Доли преступлений (/)
Середина интервала
(*ср.)
Произведения
(Л*р.)
Отклонения
(*ср.-*)
Дисперсия
(*ср. - *)
до 15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-60
3 11
22 26 19 10 5 3 1
14,5 18 23 28 33 38 43 48 55,5
43,5 198 506 728 627 380 215 144 55,5
-14,47 -10,97 -5,97 -0,97 +4,03 +9,03 + 14,03 +19,03 +26,53
209,4 120,3 35,6 0,9 16,2 81,5 196,8 362,1 703,8
1/ = юо
I/V"
2897
1(хср.-х)2 = 1726,6
Если изобразить полученные результаты графически, то при имеющихся данных х = 28,97 и Мо = 27,5, откуда 1с > Mo, ах – – Мо = 1,47, мы получим график с правосторонней асимметрией и положительным коэффициентом КА = 0,1. Он будет близок к графику, изображенному на рис. 3.
Мы провели полный расчет коэффициента асимметрии с ее графическим изображением для иллюстрации аномальных возможностей вариационных рядов, по многочисленным показателям которых можно проводить углубленный статистический сравнительный анализ.
При моделировании рядов распределения в целях сравнения реального вариационного ряда с нормальным распределением можно проверить их соответствие на основе выравнивания фактического распределения по кривой нормального распределения. Для этого частоты фактического распределения сравниваются с теоретическими частотами, которые вычисляются на основе имеющихся фактических данных, находят нормированные отклонения, а затем по их величине рассчитывают частоты теоретического нормального отклонения.
Математической статистикой также разработано несколько показателей, по которым можно судить о том, как согласуется фактическое распределение. Эти показатели называются критерием согласия. Их много. Наибольшее распространение имеет кри-
282
терий согласия Пирсона (критерий % - хи-квадрат), который рассчитывается по формуле
х2=:
(/-/т)2
/т
где/– эмпирические частоты; /j. – теоретические частоты.
Для оценки близости эмпирического распределения к теоретическим определяют вероятность достижения хи-квадратом величины P(-i) при случайных колебаниях. Если вероятность выше"* 0,05, то отклонения фактических частот от теоретических можно считать случайными, а если меньше, то эмпирическое распределение является принципиально отличным от рассчитанного теоретического. Для простоты расчетов статистиками разработаны специальные таблицы вероятностей Дх2)> которые обычно приводятся в виде приложений к учебникам по общей теории статистики.
Следующий критерий согласия – критерий Колмогорова (критерий лямбда), который обозначается символом А. (лямбда). Этот критерий используется при анализе близости фактического и теоретического распределений путем сравнения кумулятивных (накопительных, фактических и теоретических) частот в вариационном ряду. Он рассчитывается по формуле
р
где Р – разность между фактической и теоретической частотой; п – число наблюдений.
По полученным результатам также в специальной таблице можно найти искомую вероятность для критерия согласия лямбда.
Вышеизложенные вопросы выравнивания фактического распределения по кривой нормального распределения, а также критерии согласия Пирсона и Колмогорова в силу недостаточной математической подготовки юристов практически не используются в юридической статистике. Исходя из реальных потребностей юридической науки и практики, небольшого объема курса юридической статистики, названные методы представлены в учебнике в кратком изложения лишь для ознакомления будущих юристов. Эти методы широко распространены среди экономистов, социологов и других специалистов, к результатам исследований которых нередко обращаются и юристы. Объем изложения упомянутых методов в учебнике дает возможность более или менее
283
адекватно оценить их при чтении специальной литературы, а по необходимости – и использовать в своей аналитической работе. При этом очень важно не скатиться к статистическому механицизму, примеры которого до сих пор не изжиты. Обратимся к одному из них.
Закономерности распределения в вариационном ряду косвенно используются в модульной теории социума1. В ней социум исследуется в виде взаимосогласованной гармоничной системы, состоящей из элементов и частей, между которыми существуют слаженные отношения, выражающиеся в устойчивых пропорциях (распределениях), которые могут измеряться в удельных весах или долях. В связи с этим было высказано предположение о наличии в социуме самых разных положительных и отрицательных девиаций (текучесть кадров, неявка на работу, травматизм, гомосексуализм и лесбиянство, алкоголизм, уклонение от участия в выборах, богачи, таланты, мигранты и т. д.), доля которых якобы не превышает 4-10%.
Закономерности распределения тех или иных явлений в обществе действительно существуют, но их доли, хотя и в некоторых пределах, относительно подвижны и зависимы от складывающихся социальных условий. Вспомним, например, распределение женщин и мужчин в структуре выявленных преступников, в котором доля женщин всегда была меньше удельного веса мужчин и в зависимости от условий (экономическая стабильность, война, кризис и т.д.) составляла 12–20–30%. Можно было бы привести множество других более или менее устойчивых распределений. Но никакой «константы необходимой дисгармонии в обществе» или криминальной сфере не наблюдалось. Тем не менее, одним из поклонников этой теории2 было выдвинуто ничем не аргументированное предположение о якобы устойчивом, повсеместном и необходимом удельном весе преступников в структуре населения (независимо от исторических традиций, социальных условий жизни, уровня криминализации общественно опасных действий в уголовном законодательстве и других обстоятельств в той или иной стране), равном 5,6% от общей численности населения (в течение года).
1 См.: Давыдов А.А. Модульная теория социума. М., 1995.
2 См.: Ли Д.А. Преступность в России. М., 1997; Его же. Преступность как социальное явление. М., 1997.
284
Исходя из этих недостоверных выводов, автор, широко используя статистические и математические методы относительных и средних величин, «с легкостью» рассчитал латентную преступность по более чем 90 странам. Подход прост: на основе численности населения в той или иной стране он исчислял общее число ежегодно наличествующих (5,6 %) преступников и путем вычитания из этого числа количества выявленных правонарушителей получал латентную преступность. Обратимся к его непосредственным расчетам. В 1985 г. в Швеции насчитывалось 8,35 млн человек населения, среди которых автор нашел 467 600 выявлен- ' ных и невыявленных преступников. Вычтя из этой суммы общее число установленных преступников, он получил 122 803 человека «незарегистрированных преступников» (термин автора этой теории).
В действительности в 1985 г. в Швеции было только зарегистрировано 1 018 349 преступлений, или 12 184 деяния на 100 тыс. населения1, что составляет 12,2% его общей численности. Для их совершения 5,6% («необходимый» удельный вес преступников в обществе) правонарушителей должны были в течение года совершить более чем по 2 зарегистрированных деяния каждый. Но кроме учтенной преступности, в Швеции существует латентная, уровень которой примерно соотносится с уровнем зарегистрированных деяний. Аналогичные данные можно получить по США (если учитывать всю преступность, а не только индексную), Великобритании, Германии, Дании, Финляндии и другим странам, где число преступлений на 100 тыс. населения в последние годы превышает 8 тыс. (или 8%).
Я привожу этот беспрецедентный пример статистических упражнений с одной целью: статистика и математика и выявляемые с их помощью законы динамики и распределения применимы в социальных и юридических науках лишь тогда, когда они опираются на адекватные базовые показатели. Если последние неверны, никакие статистические измерения и расчеты, какими бы точными они ни были, не приведут к объективным результатам. Немецкий математик К.Гаусс обоснованно предостерегал: математика -это мельница. Она перемелет все, что угодно, но получится ли мука, будет зависеть от того, что в нее было засыпано.
1 Rattsstatistsk arsbok. Stocholm, 1989. P. 39-41; Crime Trends in Sweden. 1988. Stocholm, 1990. P. 121-125.
285
Закономерности статистических распределений вполне могут быть использованы в модульной теории социума, в том числе и для изучения распределения криминальных и иных противоправных отклонений, но эти закономерности должны отражать реалии, а не предположения.
Структурная схема средних величин
Средние величины
Степенные
Конкретные
Средняя арифметическая
Мода
Средняя геометрическая
Медиана
Средняя гармоническая
Средняя квадратическая
Размах вариации
Среднее линейное отклонение
Дисперсия
Коэффициент вариации