§ 3. Расчет выборочной совокупности

Каждый исследователь, желающий получить достоверные данные о генеральной совокупности изучаемых явлений и процессов, стоит перед проблемой определения объема выборочной совокупности (я). Он определяется исходя из заданных и наличных показателей. Заданными показателями в этом случае будут предельная ошибка репрезентативности (W или А), коэффициент доверия (0, а наличными – дисперсия (о2) изучаемых признаков и (в некоторых случаях) численность генеральной совокупности (W).

Формулы расчета выборочной совокупности выводятся из формул расчета ошибок репрезентативности.

\р(\ – р) Из формулы W = J-i-----'-, по которой рассчитывается ошибка

повторной выборки качественного признака при коэффициенте доверия /= 1, может быть легко вычислен объем выборки. Для

131

этого необходимо знать значение удельного веса признака и задать предельную ошибку выборки. Обратимся к известному примеру. Доля лиц, совершивших преступления в состоянии опьянения (Р), составляла 35%, или 0,35. Предельную ошибку (W) зададим равной ± 5%, или 0,05. В этом случае

^ Р(\ - Р) = 0,35(1 W1

• 0,35)

0,0025

= 91 преступление (дело, статкарта, приговор).

Если задать ошибку, равной ± 4%, то следует изучить 143 единицы, ± 3% - 225, ±296- 575 и т.д.

Из формулы W = J– , по которой

I П

определяется однократная

ошибка повторной выборки количественного признака, объем выборочной совокупности можно рассчитать после нахождения дисперсии (о2) и необходимой предельной ошибки выборки (W). Вновь обратимся к примеру о сроках лишения свободы. В нем а2 = = 2,29 года, W= ± 0,15 года. Найдем объем выборочной совокупности (/?):

2,29 0,0225

= 102 единицы.

Это означает, что если нас удовлетворяет ошибка выборки, равная ±0,15, то следует изучить 100 преступлений (дел, стат-карт и т. д.), а если она допустима в пределах ± 0,3, то достаточно 25 единиц изучения.

Выше говорилось, что коэффициент доверия, равный 1 (/=1), недостаточно надежен, так как только 683 единицы из 1000 могут быть в пределах заданной ошибки репрезентативности. Поэтому чаще всего при расчете объема выборочной совокупности вводится коэффициент доверия, равный 2 (/=2), который означает, что в 954 случаях из 1000 число единиц выборочной совокупности будет находиться в пределах заданной ошибки репрезентативности. С этой целью в приведенные формулы, как и при расчете ошибки репрезентативности, вводится коэффициент /.

Из формул предельных ошибок повторной выборки для качественных и количественных признаков выведем формулы расчета объемов выборочной совокупности.

132

Из д

следует и =

(качественные признаки).

Из д = /J– следует п = -~- (количественные признаки).

V и      А

Принимая / = 2 и используя данные предыдущих примеров, определяем объемы выборочных совокупностей для качественных и количественных признаков:

, ч 0,35(1-0,35) 4          "*"

п (кач.) =-----^ пппг, '– -- 364 преступления;

и (колич.) =

2,29 4

= 407 преступлений.

0,0225

Расчеты выборочных совокупностей показывают, что если повысить коэффициент доверия вдвое (/=2), то объем выборки необходимо увеличить вчетверо, ^то означает, что в пределах тех же ошибок репрезентативности ± 5% и ± 0,15 года теперь будет находиться не 683, а 954 единицы из 1000. В этих случаях ошибка выборки именуется двукратной, поскольку распространяется на все единицы выборочной совокупности, расположенные в пределах 28 нормального распределения.

Все предшествующие расчеты производились для повторной выборки. В реальной жизни криминологические и социально-правовые изучения проводятся, как правило, бесповторным способом, т. е. уголовное дело, статкарта, гражданское дело и т. д. по какому-то признаку изучаются или респонденты (при анкетировании) опрашиваются единожды. В этом случае применяются формулы для бесповторной выборки.

Из д =

- – следует и =

Nt2P(\ - Р)

= –-------i-------'–-

+ t2P(\ - Р)

Л/ЬЧ

2,2

> = ',–1--7Г следует л = –

11 /1 I,  N )    £f,, т, и

Эти формулы расчета выборочных совокупностей для качественных и количественных признаков являются наиболее полными. В них учтены коэффициент доверия, кратность предельной ошибки и бесповторность выборки. Пользуясь этими формулами, рассчитаем выборочные совокупности для известных данных.

133

Итак, дано:

Р (удельный вес признака)

А (предельная ошибка выборки)

/ (коэффициент доверия)

N (генеральная совокупность)

= 35 %, или 0,35;

= 5 %, или 0,05;

= 2;

– 5000.

п =

п (выборочная совокупность)

5000 • 4 • 0,35 • (1 - 0,35) _ 4600 O.OD25 5000 + 4 0,35 (1-0,35) ~ 13,42

= 343 преступления.

Если уменьшить ошибку выборки до ±3%, то выборочная совокупность должна быть увеличена до 848 единиц, если до ± 2 % – объем выборки должен составить 1575 единиц.

Второй пример решим применительно к количественному признаку.

Дано:

о2 (дисперсия)     = 2,29 года;

Д (предельная ошибка выборки) = 0,15 года;

t (коэффициент доверия)  = 2;

N (генеральная совокупность) = 3000.

(выборочная совокупность)

3000 4 2,29  27480

0,0225 3000 + 4 2,29 67,5 + 9,16

= 358 преступлений.

Увеличение генеральной совокупности вдвое, т. е. до 6000, увеличит выборку ненамного, лишь до 381 единицы. Это говорит о том, что объем генеральной совокупности – относительно второстепенный параметр даже при расчете объема бесповторной выборки, хотя он и стоит в формуле расчета. При повторной выборке объем генеральной совокупности не имеет никакого значения, поэтому он отсутствует в формуле расчета как дисперсии, так и численности выборки. Следовательно, там, где численность генеральной совокупности по тем или иным причинам точно не известна, ею можно пренебречь и рассчитывать выборочную совокупность по формулам повторной выборки или использовать приблизительную численность генеральной совокупности.

Для определения объема повторной выборки по качественному признаку можно использовать табл. 6. Как и табл. 5 (о пределах ошибок), она рассчитана применительно к коэффициенту доверия, равному 2 (/=2).

134

Таблица 6

Число наблюдений, необходимое для того, чтобы ошибка не превысила заданного предела (t=2)

Удельный вес

Предел ошибки, %

наблюдений, %

 

 

1

2

3

4

5

10

10 (90)

3600

900

400

230

150

37

15 (85)

5100

1300

570

320

210

52

20 (80)

6400

1600

710

400

260

65

25 (Z5i

75ПП

19ПП

аза

470

ям

76

30 (70)

8400

2100

930

530

340

85

35 (65)

9100

2300

1010

570

370

92

40 (60)

9600

2400

1070

600

390

97

45 (55)

9900

2500

1100

620

400

100

50 (50)

10 000

2500

1110

630

400

100

Примечание. Таблица приводится в сокращенном виде.

Предположим, что удельный вес изучаемого признака равен 25%. Находим этот показатель в первой графе табл. 6. Рассматривая строку (она подчеркнута), на которой находится 25% (75%), слева направо, мы увидим, что при заданной ошибке ± 1% численность выборки должна составить 7500 единиц, при ± 2% -1900, при ± 3% - 830, при ± 4% - 470, при + 5% - 300 единиц и т. д. Исходя из того, какая ошибка может быть признана допустимой при том или ином изучении, и определяется объем выборочной совокупности.

В криминологических и других социально-правовых исследованиях чаще всего бывает достаточной выборка до 300–400 единиц. Даже при максимальной колеблемости качественного признака 50% (дисперсия -- 0,25) предельная двукратная ошибка выборки составляет ±5%, при удельном весе признака 20% (80%) – ±4%, при удельном весе признака 10% (90%) – ± 3%.

«все книги     «к разделу      «содержание      Глав: 77      Главы: <   27.  28.  29.  30.  31.  32.  33.  34.  35.  36.  37. >