§ 6. Показатели вариации признака
Средние величины раскрывают важную обобщающую характеристику совокупности по варьирующему признаку. Рассчитав их, необходимо уяснить, насколько они показательны, типичны или однородны. Одинаковые средние могут характеризовать совершенно разнородные совокупности. Покажем это на элементарном примере, который будем усложнять по мере расчета новых показателей вариации.
Предположим, что в одном суде 10 осужденным были назначены такие сроки лишения свободы: 1, 2, 3, 3, 4, 9, 10, 12, 13, 15 лет, а в другом также 10 осужденным было назначено: 6, 6, 7, 7, 7, 7, 8, 8, 8, 8 лет. Средняя арифметическая в обоих случаях будет одинаковой:
Зс, = £*: « = (1+2 + 3 + 3 + 4 + 9 + 10 + 12 + 13 + 15): 10 = 72 : 10 = 7,2 года; х2 = ^х: « = (6 + 6 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8): 10 = 72: 10 = 7,2 года.
Средние равны, а ряды существенно различаются между собой: первый ряд менее однороден, чем второй, следовательно, и средняя первого ряда менее показательна и менее надежна, чем средняя второго.
Для того чтобы наши суждения о различиях подобных вариационных рядов были статистически точными, можно прибегнуть к показателям отклонений различных вариант от средней. Возьмем пока крайние отклонение. В первом ряду отклонения первого члена (1) от средней (7,2) равно-6,2, отклонение де-
272
сятого члена (15) от средней (7,2) равно+7,8. Во втором ряду аналогичные отклонения равны -1,2 и +0,8. Полученные результаты уже можно математически сопоставлять и измерять. Они подтверждают наши предварительные суждения. Теперь рассчитаем все отклонения значений признаков обоих вариационных рядов от средней арифметической и сведем эти расчеты в табл. 9.
Таблица 9
Расчет отклонений
№ п/п
Первый суд
Второй суд
Сроки лишения свободы
м
Отклонения от средней
(х-х)
Квадрат отклонений
(*-*)'
Сроки лишения свободы
(X)
Отклонения от средней
(х-х)
Квадрат отклонений
(х-.х)2
1
1
-6,2
38,44
6
-1,2
1,44
2
2
-5,2
27,04
6
-1,2
1,44
3
3
-4,2
17,64
7
-0,2
0,04
4
3
-4,2
17,64
7
-0,2
0,04
5
4
-3,2
10,24
7
-0,2
0,04
6
9
+ 1,8
3,24
7
-0,2
0,04
7
10
+2,8
7,84
8
+0,8
0,64
8
12
+4,8
23,04
8
+0,8
0,64
9
13
+5,8
33,64
8
+0,8
0,64
10
15
+7,8
60,84
8
+0,8
0,64
Итого 72
0
239,60
72
0
5,6
Первый и наиболее простой показатель вариации – это размах вариации R. Он исчисляется в виде разности между наибольшими и наименьшими значениями варьирующего признака:
"• ~ '"'max ~ Хтт-
В первом суде размах вариации наказания оказался равным Л, = 15 - 1 = 14, а во втором – Кг = 8 - 6 = 2. Различия существенны: R} > R2 в 7 раз. Но может случиться так, что и размах вариации будет одинаковым, равным. Например, /{, = 15-10 = 5; /?з = 8-3 = 5, хотя ряды существенно различаются между собой. Размах вариации улавливает только крайние отклонения, но не отражает отклонений от средней всех значений признака в
273
1X7
вариационном ряду. Последнее можно получить, если рассчитать отклонения всех вариант от средней (х, - ~х ) + (х2 - ~х) + и т. д. (графы 3 и 6 табл. 9) и исчислить среднюю арифметическую из всех отклонений.
При изложении средней арифметической величины мы установили, что сумма всех положительных (которые больше средней) и всех отрицательных (которые меньше средней) отклонений равна нулю, что мы и видим в итоге граф 3 и 6 табл. 9. Поэтому при расчете средней арифметической из отклонений необходимо абстагироваться от знаков «+» и «-». В этом случае сумма отклонений £(х - х), разделенная на число отклонений п, а при наличии частот – на число /, и будет средним арифметическим отклонением. В связи с этим расчетная формула будет выглядеть так:
К*-*)/
~
В результате мы получили среднее арифметическое (линейное) отклонение, которое обозначается символом d. Это вторая мера измерения вариации признака.
Среднее арифметическое (линейное) отклонение в статистическом анализе применяется редко. Обычно используют третий показатель вариации – дисперсию, или средний квадрат отклонений. Она обозначается символом а2 (сигма малая в квадрате) и представляет собой то же среднее арифметическое отклонение (</), но только отклонения возведены в квадрат и из квадратов отклонений исчисляют среднюю величину:
а2 = – – - , а при наличии частот а2 =
~х'
2-t *
При расчете дисперсии не надо абстрагироваться от знаков (+ и -) отклонений, так как при возведении в квадрат все знаки отклонений становятся положительными.
Если извлечь корень квадратный из дисперсии, то мы получим следующий, четвертый, показатель вариации – среднее квад-ратическое отклонение, которое обозначается символом а (сигма малая):
274
0* =
*
а при наличии частот а =
х> -•
L,J
Дисперсия и среднее квадратическое отклонение являются наиболее распространенными и общепринятыми показателями вариации изучаемого признака.
В юридической статистике они используются при сравнительных статистических исследованиях, для обоснования ошибки репрезентативности (ошибки выборки) выборочного наблюдения, а также при изучении корреляционных и иных статистических связей между признаками фактора и признаками следствия, или между причиной и следствием.
Дисперсия и среднее квадратическое отклонение обладают рядом свойств, которые приводятся без доказательств:
1) дисперсия постоянной величины равна нулю;
2) дисперсия не меняется, если все варианты увеличить или уменьшить на какое-то постоянное число Л;
3) если все варианты умножить на какое-то постоянное число А, то дисперсия увеличится в А2 раз, а среднее квадратическое отклонение – в А раз;
4) если все варианты разделить на какое-то постоянное А, то дисперсия уменьшится в Аг раз, а среднее квадратическое отклонение – в А раз.
Эти и другие свойства дисперсии могут быть использованы для упрощения и оптимизации техники расчетов.
В графах 4 и 7 табл. 9 мы находим квадрат отклонения каждой варианты и их суммы. Использовав их, мы и рассчитаем дисперсию и среднее квадратическое отклонение для мер наказания 1-го и 2-го судов.
Дисперсия о?=
10
= 23,96 для первого суда, а
среднее квадратическое отклонение: о, = д/of = ,/23,96 = 4,9 года. Дис-
Персия 02 =
• = -^- = 0,56 для второго суда, а среднее квад-
ГТ I-----
ратическое отклонение: о2 = v°2 = Д56 = 0,75.
Таким образом, меры наказаний, вынесенные первым судом, отклоняются от среднего на 4,9 года, а вынесенные вторым судом – на 0,75 года. Разница достигает 6,5 раза. Это суше-
275
ственно. Таким образом, средняя второго суда действительно более надежна, типична и показательна.
Пятый (по счету) показатель вариации -- это коэффициент вариации. В отличие от размаха вариации, среднего линейного, среднего квадратического отклонения и дисперсии, которые выражаются в абсолютных и именованных числах, коэффициент вариации является показателем относительным. Он выражается в процентах, обозначается символом У и рассчитывается по формуле:
где V – коэффициент вариации; о – среднее квадратическое отклонение; х средний арифметический показатель.
В наших примерах коэффициент вариации будет равен: 4,9-100%
= 68>1% Для первого суда;
0,75-100% 7,2
= 10,4% для второго суда.
Коэффициент вариации предоставляет большие возможности для сравнительных изучений, поскольку сравнивать, например, средние квадратические отклонения вариационных рядов с разными уровнями непосредственно нельзя. Коэффициент вариации в известной мере является критерием типичности средней. Если он относительно большой (например, выше 40%), то это значит, что типичность такой средней очень невысока. И наоборот, если его значение малое, то средняя является типической и надежной.
«все книги «к разделу «содержание Глав: 77 Главы: < 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. >