7.1 Понятие и основные свойства выборочного наблюдения
Теория выборочного наблюдения базируется на статистических закономерностях, которые форми-
руются и обнаруживаются в массовых явлениях и процессах. Это свойство закономерностей получило
название закона больших чисел. Математической основой закона больших чисел, да и статистической
науки в целом, служит теория вероятностей, представляющая собой раздел математики, в котором изу-
чаются случайные явления (события), имеющие устойчивую частость, а следовательно, и вероятность,
что помогает выявлять закономерности при массовом повторении явлений.
Исходя из закона больших чисел, чем больше изученная сово-купность случайных явлений, тем
должно быть более упорядоченным распределение полученных данных.
Упорядоченность изменения случайных величин называется закономерностью распределения и
графически представляется с помощью гистограммы или полигона распределения. Гистограмма, или
полигон распределения, представляет собой ломаную кривую, характеризующую фактическое распре-
деление полученных данных. Она позволяет выявить лишь приближенную картину распределения всей
(генеральной) совокупности. Чем больше выборочное изучение, тем в большей мере будут сглаживать-
ся влияние случайных причин и явственнее проступать действительная закономерность распределения.
В этом случае кривая распределения фактических данных будет приближаться к теоретической кривой
распределения.
В математической статистике теоретическую кривую распределения обычно называют кривой Лап-
ласа-Гаусса, или нормальным распределением.
Распределение данных наиболее полно характеризуется следующими параметрами: размахом ва-
риации и отклонением от среднего арифметического значения.
Размах вариации (колебаний) – наиболее простой параметр измерения разброса значений варьи-
рующего признака. Он исчисляется по формуле
R = хmax – хmin. При одном и том же размахе вариации совокупности данных могут существенно разли-
чаться по структуре, т.е. быть более или менее однородными.
Средняя арифметическая величина рассчитывается по следующей формуле
n
x x x x x n + + + +
= ... 3 2 1 ,
где x1, x2, ..., xn – значения показателей; n – число значений.
Вместо средней арифметической можно использовать также средневзвешенную величину:
.
+ + + +
=
f
f x f x f x f x x n n ... 3 3 2 2 1 1
взв ,
где f1, f2, ..., fn – частоты появления показателей.
Средняя арифметическая лежит в основе расчета дисперсии (колеблемости), которая представляет
собой не что иное, как значение отклонения всех вариант от средней. Значение дисперсии и предопре-
деляет объем выборочной совокупности. Чем больше дисперсия, тем больше разброс показателей от
средней, а следовательно, нужен больший объем выборки, чтобы она была достаточно репрезентатив-
ной.
Дисперсия – это средний квадрат отклонения изучаемого признака от теоретического (среднего)
показателя. Она характеризует уровень однородности исследуемой совокупности и обозначается сим-
волом «у2» (сигма малая в квадрате).
Определение объема и представительности выборочной совокупности, а следовательно, и диспер-
сии производится применительно не к преступности, административной правонарушаемости или дру-
гим социально-правовым явлениям вообще, а лишь к их конкретным показателям. Последние могут
быть качественными, или атрибутивными (вид преступления, содержание мотива, свойства личности и
т.д.) и количественными (возраст правонарушителей, уровень образования, повторность совершения
f
x
101
преступления, сроки рассмотрения гражданских дел и т.п.). Каждый признак имеет свою дисперсию, а
следовательно, и необходимый объем выборки для надежного изучения. Это значит, что при выбороч-
ном изучении многих признаков, чтобы выявить совокупные отклонения, дисперсию надо рассчитывать
по каждому из них. Иногда эти признаки исчисляются десятками и даже сотнями. Чтобы избежать мно-
жества расчетов, можно ограничить их только в отношении тех признаков, на базе которых делаются
основные выводы. Общая численность выборки или ее общая репрезентативность определяются по со-
вокупной представительности всех параметров.
При наличии удельного веса качественного признака его дисперсия рассчитывается по следующей
формуле
у2 = Р (1 – Р),
где Р – доля качественного признака, а (1 – Р) – доля иных признаков или противоположного признака.
Дисперсия количественного признака рассчитывается по формуле:
( ) ( ) ( ) ( ) ( )
n
n
f f f f
f x x f x x f x x f x x
f
f x x
+ + + +
- + + - + - + -
=
-
= у .
.
...
...
3 2 1
2
1 3
2
1 2
2
1 1
2
1
2
2 ,
где у2 – дисперсия; x1, x2, ..., xn – значения признаков; х – среднее арифметическое значение признака;
f1, f2, ..., fn – частоты появления признаков.
Извлекая корень квадратный из дисперсии, получаем среднее квадратическое отклонение:
( ) P P - = у 1 – для качественных признаков;
( )
.
. -
= у
f
f x x 2
2 – для количественных признаков.
СКО позволяет правильно оценить надежность
выборочных показателей. Если площадь, ограниченную кривой
нормального распределения, принять за 1 или 100 %,
то площадь, заключенная в пределах 1у вправо и влево от средней
арифметической, составит 0,683 всей площади. Это означает, что
68,3 % всех изученных вариант отклоняются от средней
арифметической не более чем на 1у, т.е. находится в пределах (х ±
с).
Площадь, заключенная в пределах 2у вправо и влево от средней
арифметической, составляет 0,954 всей площади, т.е. 95,4
% всех единиц совокупности находится в пределах (х ± 2у). Площадь, заключенная в пределах 3у влево
и вправо от средней арифметической, составляет 0,997 всей площади, или 99,7 % всех единиц совокуп-
ности находится в пределах
(х ± 3у). Это и есть так называемое правило трех сигм, характерное для нормального распределения
(см. рис. 6).
«все книги «к разделу «содержание Глав: 46 Главы: < 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. >