§ 2. Измерение связей между качественными признаками

Статистические методы различных обобщений, указывая на наличие прямой или обратной связи между признаком-фактором и признаком-следствием, не дают ответа на вопрос о мере связей, ее количественном выражении. Этот недостаток восполняется методами корреляционного анализа, которые позволяют вычленить из комплекса факторов влияние одного или многих обстоятельств, установить характер взаимосвязи и математически точно измерить ее. Все это имеет важное научное и практическое значение. Последовательное внедрение методов измерения в аналитическую практику правоохранительных органов, судов и других юридических учреждений ставит ее на прочную научную основу.

Для изучения корреляционных связей статистиками разработаны разные методы, каждый из которых решает свои конкретные задачи. Одни коэффициенты связи пригодны для измерения

313

взаимосвязей качественных признаков, другие – для качественных и количественных, третьи – для количественных. Абсолютное большинство их применимо в социально-правовых и криминологических изучениях, поэтому необходимо познакомиться с ними хотя бы в самом общем виде.

Для измерения связи между качественными (атрибутивными) признаками в статистике широко используются коэффициент сопряженности А.А.Чупрова, коэффициент ассоциации К.Пирсона, а также коэффициенты ранговой корреляции Спирмена и Кендалла.

1. Коэффициент ассоциации К.Пирсона (КП) в плане исчисления – относительно простой показатель сопряженности величин. Он применяется к вариации двух качественных признаков, распределенных по двум группам. Его расчет производится на основе табл. 1, именуемой таблицей четырех полей.

Таблица 1

Таблица расчета коэффициента ассоциации К.Пирсона

Табл и ца 2

~\^ГТризнаки Группы "~~ ~^^^

1

2

Сумма

1

а

Ъ

а+Ь

2

с

d

c+d

Сумма

а+с

b+d

-

Этими полями являются клетки а, Ь, с, d. Расчет осуществляется на основе сопряжения по строкам а и Ь, с и d, а также по графам а к с, bud. Формула расчета:

ad~bc

Ассоциируемые показатели могут быть как абсолютными, так и относительными. Попробуем рассчитать КП между показателями раненых и погибших в дорожно-транспортных происшествиях по вине водителей и пешеходов (табл. 2).

Ввиду того, что абсолютные показатели громоздки и расчет КП на их основе можно сделать будет только на компьютере, исчислим его на относительных показателях, на процентах:

кп

15,5 86,2-84,5 13,8

+170

+170

100-29,3 170,7 V50 015 100 7072

= +0,02.

Распределение погибших и раненых по вине водителей и пешеходов

Причина наезда

Погибло

Ранено

Сумма

Вина водителей

(а) 26807 15,5 %

(Ь) 146 685 84,5%

173 492 100,0 %

Вина пешеходов

(с) 6451 13,8 %

(d) 40293 86,2%

46784 100,0 %

Сумма

33258 29,3%

186978 170,7 %

-

Проверка расчета КП на абсолютных показателях дала практически те же результаты (0,0188). Расхождение расчетов на десятитысячные доли объясняется наличием округлений при расчете процентов.

Коэффициент ассоциации измеряется от –1 до +1 и интерпретируется так: чем ближе коэффициент к 1, тем теснее связь, положительная или отрицательная. Исходя из этого связь между показателями раненых и погибших по вине водителей и пешеходов прямая (+), но незначительная и случайная. Считается, что если КП достигает 0,3, то это свидетельствует о существенной связи между признаками.

2. Коэффициент взаимной сопряженности, разработанный отечественным статистиком А.А.Чупровым (КЧ), в отличие от коэффициента Пирсона применяется для измерения связи между соотношением двух атрибутивных признаков по трем и более группам. Он рассчитывается по формуле

кч =

где КЧ – коэффициент взаимной сопряженности А.А.Чупрова; <р2 – показатель взаимного сопряжения (фи квадрат), от, и тг – число групп по каждому признаку; 1 – постоянный коэффициент

Поскольку число групп всегда известно, то для расчета КЧ необходимо найти ф2 (фи квадрат). Его расчет сложный. Он, как и коэффициент Пирсона, исчисляется путем нахождения различных соотношений, что легче всего сделать на конкретном примере. В качестве такового возьмем соотношение некоторых

314

315

видов преступлений и их раскрываемости (табл 3). В нашем примере /и, – число видов деяний, равное 4, и т2 – число групп по раскрываемости преступлений (раскрыты, нераскрыты), равное 2.

Таблица 3

Распределение некоторых преступлений в регионе по видам и их раскрываемости

Виды преступлений

Раскрыты

Не раскрыты

Итого

Разбой

ПО (73,7 %) 12 100 34,5714

40 (26,3 %) 1600 10,6667

150 (100 %)

45,2381 0,3016

Мошенничество

180 (73,5 %) 32 400 92,5714

65 (26,5 %) 4225 28,1667

245 (100 %)

120,7381 0,4928

Умышленное убийство

50 (66,7 %) 2500 7,1429

25 (33,3 %) 625 4,1667

75 (100 %)

11,3096 0,1508

Поджог

10 (33,3 %) 100 0,2857

20 (66,7 %) 400 2,6667

30 (100 %)

2,9524 0,0984

Итого

350

150

500 1,0436

Для того чтобы разобраться в этой таблице, раскроем значение каждого показателя и способы его получения на примере разбоев.

В первой строке каждой клетки (кроме итоговой графы) указаны абсолютные числа и удельные веса (в скобках) раскрытых и нераскрытых преступлений (разбой, мошенничество и т. д.). Применительно к разбоям: раскрыто НО деяний, или 73,7%, и не раскрыто 40, или 26,3%.

Во второй строке каждой клетки (кроме итоговой графы) указаны квадраты частот преступлений. Применительно к разбоям: 110 раскрытых деяний в квадрате составляет 12 100, а 40 нераскрытых в квадрате составляет 1600.

В третьей строке каждой клетки (кроме итоговой графы) указаны частные от деления квадратов частот на сумму частот по графам (эти суммы указаны в нижней строчке «Итого»). Приме-

316

нительно к раскрытым разбоям: 12 100:350=34,5714 и применительно к нераскрытым: 1600:150=10,6667.

Каждая клетка итоговой графы состоит из четырех строк:

- в первой строке даны суммы частот и частостей (НО раскрытых разбоев + 40 нераскрытых =150, или 100%);

- во второй строке -- прочерк, так как квадраты частот не суммируются;

- в третьей строке даны суммы частных от деления квадратов частот на суммы частот раскрытых и нераскрытых деяний, применительно к разбою: 34,5714 (раскрытые)+10,6667 (нераскрытые) =45,2381;

- в четвертой строке дается отношение сумм частных (указанных в предыдущей третьей строке) к общему числу частот (указанных в первых строках каждой клетки), применительно к разбою 45,2381:150 = 0,316.

В итоговой строке итоговой графы приводятся два числа: первое – общее число частот (500 преступлений) и второе – общая сумма отношений, указанных в четвертой строке предыдущих клеток итоговой графы (0,3016 + 0,4928 + 0,1508 + 0,984 = 1,0436).

Результирующее число 1,0436, вобравшее в себя все статистически значимые отношения, за вычетом единицы, т.е. 1,0436 - 1 = = 0,0436, является именно фи квадратом (ф2), указывающим на взаимную сопряженность атрибутивных признаков нескольких групп. Имея его, мы легко рассчитаем КЧ по предложенной формуле:

КЧ =

0,0436

Коэффициент А.А.Чупрова в отличие от коэффициента ассоциации варьирует от 0 до 1. Если исходить из формулы, то его значение не может быть отрицательным. Но суть интерпретации та же. Связь считается существенной при величине КЧ = 0,3. Чем ближе его значение к единице, тем сильнее связь. КЧ = 0,16 – свидетельство наличия относительно заметной связи между видами преступлений и их раскрываемостью.

3. Особая роль в выявлении связей не только между качественными, но и количественными признаками принадлежит параллельным статистическим рядам. С одной стороны, они представ-

317

 

1 См.: Лунеев В.В. Мотивация преступного поведения. М., 1991. С. 249. 318

личных видов преступлении. Корыстные преступления совершаются с целью добычи денег на приобретение спиртного; насильственные действия -вследствие снятия нравственно-правовых тормозов у субъектов, находящихся в состоянии опьянения; совершению легкомысленных (неосторожных) деяний, например, дорожно-транспортных, способствует ослабление реакции и другие воздействия алкогольного опьянения на психическое и физическое состояние субъектов преступления . Существующие взаимосвязи между пьянством и преступностью в нашей стране особо четко проявились в последние 10-15 лет, когда в середине 80-х гг. пьянство интенсивно росло; когда в 1986-1987 гг. прошла кампания ожесточенной борьбы с пьянством и алкоголизмом, когда в процессе распада Союза и непродуманных реформ в России был снят государственный контроль за производством и оборотом алкогольных напитков. Все это наглядно отразилось на динамике преступности в целом и ее отдельных групп и видов. В 1983-1985 гг. уровень преступности интенсивно рос, в 1986-1987 гг. -метно снижался, а в 1998-1990 гг. рост преступности был беспрецедентным. Между потреблением алкогольных напитков и

зи между ними. Связь прямая и достаточно сильная, хотя и динаковая по силе и механизму действия при совершении раз-

преступлений и количество потребления алкоголя в литрах на 100 тыс. населения), мы можем выявить наличие и характер свя-

ностью. Сопоставив за несколько лет два динамических ряда (число

явлений. Обратимся к известному примеру о связи пьянства с преступ-

изменения одного явления в рядах распределения или динами ки, но и установить взаимосвязанное изменение двух или более

занных между собой. Они дают возможность не только увидеть

иных корреляций. Параллельные ряды в этом смысле представляют собой сопоставление двух и более статистических вариационных или динамических рядов показателей, причинно или иным способом свя-

ляют собой относительно самостоятельный и важный метод выявления корреляционной зависимости, с Другой, – с их сопоставления начинается расчет однофакторных, многофакторных и

IT

hi

§ 8 - ^ И 8 ш

ойон>аь

3 S i S 5 в 1 1

i

Sl 1 1 III

' s » • E

x я

•и Ъ TZ П)

-s g

155 о

eq

S £

P S

*- о

•*^s i^

i

о

ев

g

о

СГ

о

» a u cr

•a

s Ж

а о

3

UJ Л Sa о * S

5 §

CO S

oi 2

Е -3

^ ** й 5 «

О О1 ы

О СГ ш

о я р я

Н So Я "О

3Sg§

Е я g^ • к-S *§

правонар лений, в

воохрани Мы о

35 £ Е

* s

0 Н . О О> О! !я S m

§Ш

Я= 0

а я I-

0 и

 

динамики, если между или иные связи. Однак

тавлены в параллельны

i последнее пятидесяти. ie показатели о юриди

ушителей было на 29% 1972 г. их уровни сравни ений на 54% превышал Анализ этих парадокса :ступности и выявленнь а очень сложные вопро

и влияют и другие фа* [юдения презумпции не) гельных органов и др. боащались к этим данн

онарушители по сути с гупности. Но на динами

 

о я о s

£|

SS

О

3

1

о

3 Q <"> И х g s Я>

Со

0

Е <<

g

X

•о Р3

и

а

V

1 о

0

о

о

больше ялись, а

Е S

ts

ВИНОВНО

S

•о

Е

><:

Я а •< о

"< §с

тз »с

О 1

и

 

гществуют реальные при-уженные совпадения мо-

;тические ряды распреде-

начимых явлениях могут

овной политики в нашей

шарушителей может дать

оотношений между уров-

выявленных правонару-

числа учтенных преступ-в 1991 г. число учтенных

956 г. число выявленных

юти, дееспособность пра-

головная политика, сте-

раскрытая часть учтен-ня выявленных правона-

 

1 Гернет М.Н. Избранные произведения. М., 1974. С. 273.

только совпадение тех условий, которые бывают во всяком жиз-

ных окружным судом за кражи» . Статистические совпадения указанных рядов объяснимы. Рост цен на хлеб может как-то отражать ухудшение экономической и криминогенной ситуации. Но выявленные корреляции характеризуют, скорее всего, не связи между кражами и ценами на хлеб, а связи между кражами и экономической ситуацией в целом. Цена на хлеб в отдельно взятой губернии – лишь какой-то косвенный индикатор экономической ситуации. Подобные корреляции могут затушевать или искажать действительное положение дел. Случайность совпадений или ложные закономерности, как правило, выясняются на основе качественного анализа и теории той научной дисциплины, статистические данные которой анализируются. Об этом образно писал Л.Н.Толстой в томе третьем части третьей романа «Война и мир»: «Всякий раз, когда я, глядя на свои часы, вижу, что стрелка подошла к десяти, я слышу, что в соседней церкви начинается Благовест, но из того, что всякий раз, что стрелка приходит на десять часов тогда, как начинается Благовест, я не имею права заключить, что положение стрелки есть причина движения колоколов. Всякий раз, как я вижу движение паровоза, я слышу звук свиста, вижу открытие клапана и движение колес; но из этого я не имею права заключить, что свист и движение колес суть причины движения паровоза. Крестьяне говорят, что поздней весной дует холодный ветер, потому что почка дуба развертывается, и действительно всякую весну дует холодный ветер, когда развертывается дуб... Я вижу

«полную зависимость между ценами на хлеб и числами осужден-

нет, например, построил параллельные ряды осужденных в Калужской губернии за кражи (в расчете на 10 тыс. населения) и цен на хлеб (в копейках за пуд), чем, как он писал, доказал

Известный отечественный криминолог и статистик М.Н.Гер-

ными закономерностями.

висело от количества детей. В обоих случаях мы имеем дело с лож-

емость. В другом говорилось обратное: чем теснее живут, тем выше рождаемость, так как получение большей жилплощади прямо за-

от размера жилплощади: чем больше площадь, тем выше рожда-

утверждалось, что рождаемость находится в прямой зависимости

гут быть случайными или ложными. В одном исследовании 60-х гг.

ненном явлении, и вижу, что, сколько бы и как бы подробно я ни наблюдал стрелку часов, клапан и колеса паровоза и почку дуба, я не узнаю причину Благовеста, движения паровоза и весеннего ветра. Для этого я должен изменить совершенно свою точку наблюдения и изучать законы движения пара, колокола и

ветра»1.

Параллельные ряды как метод выявления взаимосвязей пользуются давно. В работе «Население, преступность и пауперизм» К.Маркс, сопоставляя в параллельных рядах численность населения, родившихся, умерших, осужденных и пауперов, установил важную закономерность: преступность растет быстрее, чем численность населения2. Со времени этого открытия прошло более ста лет, а выявленные закономерности действуют. По данным Четвертого обзора ООН о тенденциях преступности (1986-1990 гг.) преступность в мире прирастала на 5% год, а население – около 1–1,5%.

Наличие параллельных рядов признака-фактора (х) и при знака-следствия (у) позволяет выявить и изобразить корреляци-

Рис.3

1 Толстой Л.Н. Собр. соч. Т. 6. М., 1958. С. 278-279.

2 См.: Маркс К., Энгельс Ф. Соч. 2-е изд. Т. 13. С. 513-515.

322

онные зависимости графически в прямоугольной системе координат.

Если отложить значения х на оси абсцисс, а значение у – на оси ординат и нанести точки соотношений х и у, то мы получим корреляционное поле, где по расположению точек можно судить о характере и степени связи (рис. 3).

Если точки беспорядочно разбросаны по всему полю (а), то какой-либо связи между признаками нет. Если они сосредоточены на оси, направленной снизу вверх и слева направо (б), то имеется прямая зависимость, а если точки распределены сверху вниз и слева направо (в), то зависимость будет обратной. Если точки при прямой или обратной зависимости не расплываются в облаке, а сосредоточены на одной линии (г), то в этом случае мы имеем сильную прямую или обратную связь.

«все книги     «к разделу      «содержание      Глав: 77      Главы: <   63.  64.  65.  66.  67.  68.  69.  70.  71.  72.  73. >