7.1 Понятие и основные свойства выборочного наблюдения

Теория выборочного наблюдения базируется на статистических закономерностях, которые форми-

руются и обнаруживаются в массовых явлениях и процессах. Это свойство закономерностей получило

название закона больших чисел. Математической основой закона больших чисел, да и статистической

науки в целом, служит теория вероятностей, представляющая собой раздел математики, в котором изу-

чаются случайные явления (события), имеющие устойчивую частость, а следовательно, и вероятность,

что помогает выявлять закономерности при массовом повторении явлений.

Исходя из закона больших чисел, чем больше изученная сово-купность случайных явлений, тем

должно быть более упорядоченным распределение полученных данных.

Упорядоченность изменения случайных величин называется закономерностью распределения и

графически представляется с помощью гистограммы или полигона распределения. Гистограмма, или

полигон распределения, представляет собой ломаную кривую, характеризующую фактическое распре-

деление полученных данных. Она позволяет выявить лишь приближенную картину распределения всей

(генеральной) совокупности. Чем больше выборочное изучение, тем в большей мере будут сглаживать-

ся влияние случайных причин и явственнее проступать действительная закономерность распределения.

В этом случае кривая распределения фактических данных будет приближаться к теоретической кривой

распределения.

В математической статистике теоретическую кривую распределения обычно называют кривой Лап-

ласа-Гаусса, или нормальным распределением.

Распределение данных наиболее полно характеризуется следующими параметрами: размахом ва-

риации и отклонением от среднего арифметического значения.

Размах вариации (колебаний) – наиболее простой параметр измерения разброса значений варьи-

рующего признака. Он исчисляется по формуле

R = хmax – хmin. При одном и том же размахе вариации совокупности данных могут существенно разли-

чаться по структуре, т.е. быть более или менее однородными.

Средняя арифметическая величина рассчитывается по следующей формуле

n

x x x x x n + + + +

= ... 3 2 1 ,

где x1, x2, ..., xn – значения показателей; n – число значений.

Вместо средней арифметической можно использовать также средневзвешенную величину:

.

+ + + +

=

f

f x f x f x f x x n n ... 3 3 2 2 1 1

взв ,

где f1, f2, ..., fn – частоты появления показателей.

Средняя арифметическая лежит в основе расчета дисперсии (колеблемости), которая представляет

собой не что иное, как значение отклонения всех вариант от средней. Значение дисперсии и предопре-

деляет объем выборочной совокупности. Чем больше дисперсия, тем больше разброс показателей от

средней, а следовательно, нужен больший объем выборки, чтобы она была достаточно репрезентатив-

ной.

Дисперсия – это средний квадрат отклонения изучаемого признака от теоретического (среднего)

показателя. Она характеризует уровень однородности исследуемой совокупности и обозначается сим-

волом «у2» (сигма малая в квадрате).

Определение объема и представительности выборочной совокупности, а следовательно, и диспер-

сии производится применительно не к преступности, административной правонарушаемости или дру-

гим социально-правовым явлениям вообще, а лишь к их конкретным показателям. Последние могут

быть качественными, или атрибутивными (вид преступления, содержание мотива, свойства личности и

т.д.) и количественными (возраст правонарушителей, уровень образования, повторность совершения

f

x

101

преступления, сроки рассмотрения гражданских дел и т.п.). Каждый признак имеет свою дисперсию, а

следовательно, и необходимый объем выборки для надежного изучения. Это значит, что при выбороч-

ном изучении многих признаков, чтобы выявить совокупные отклонения, дисперсию надо рассчитывать

по каждому из них. Иногда эти признаки исчисляются десятками и даже сотнями. Чтобы избежать мно-

жества расчетов, можно ограничить их только в отношении тех признаков, на базе которых делаются

основные выводы. Общая численность выборки или ее общая репрезентативность определяются по со-

вокупной представительности всех параметров.

При наличии удельного веса качественного признака его дисперсия рассчитывается по следующей

формуле

у2 = Р (1 – Р),

где Р – доля качественного признака, а (1 – Р) – доля иных признаков или противоположного признака.

Дисперсия количественного признака рассчитывается по формуле:

( ) ( ) ( ) ( ) ( )

n

n

f f f f

f x x f x x f x x f x x

f

f x x

+ + + +

- + + - + - + -

=

-

= у .

.

...

...

3 2 1

2

1 3

2

1 2

2

1 1

2

1

2

2 ,

где у2 – дисперсия; x1, x2, ..., xn – значения признаков; х – среднее арифметическое значение признака;

f1, f2, ..., fn – частоты появления признаков.

Извлекая корень квадратный из дисперсии, получаем среднее квадратическое отклонение:

( ) P P - = у 1 – для качественных признаков;

( )

.

. -

= у

f

f x x 2

2 – для количественных признаков.

СКО позволяет правильно оценить надежность

выборочных показателей. Если площадь, ограниченную кривой

нормального распределения, принять за 1 или 100 %,

то площадь, заключенная в пределах 1у вправо и влево от средней

арифметической, составит 0,683 всей площади. Это означает, что

68,3 % всех изученных вариант отклоняются от средней

арифметической не более чем на 1у, т.е. находится в пределах (х ±

с).

Площадь, заключенная в пределах 2у вправо и влево от средней

арифметической, составляет 0,954 всей площади, т.е. 95,4

% всех единиц совокупности находится в пределах (х ± 2у). Площадь, заключенная в пределах 3у влево

и вправо от средней арифметической, составляет 0,997 всей площади, или 99,7 % всех единиц совокуп-

ности находится в пределах

(х ± 3у). Это и есть так называемое правило трех сигм, характерное для нормального распределения

(см. рис. 6).

«все книги     «к разделу      «содержание      Глав: 46      Главы: <   27.  28.  29.  30.  31.  32.  33.  34.  35.  36.  37. >