§ 3. Расчет выборочной совокупности
Каждый исследователь, желающий получить достоверные данные о генеральной совокупности изучаемых явлений и процессов, стоит перед проблемой определения объема выборочной совокупности (я). Он определяется исходя из заданных и наличных показателей. Заданными показателями в этом случае будут предельная ошибка репрезентативности (W или А), коэффициент доверия (0, а наличными – дисперсия (о2) изучаемых признаков и (в некоторых случаях) численность генеральной совокупности (W).
Формулы расчета выборочной совокупности выводятся из формул расчета ошибок репрезентативности.
\р(\ – р) Из формулы W = J-i-----'-, по которой рассчитывается ошибка
повторной выборки качественного признака при коэффициенте доверия /= 1, может быть легко вычислен объем выборки. Для
131
этого необходимо знать значение удельного веса признака и задать предельную ошибку выборки. Обратимся к известному примеру. Доля лиц, совершивших преступления в состоянии опьянения (Р), составляла 35%, или 0,35. Предельную ошибку (W) зададим равной ± 5%, или 0,05. В этом случае
^ Р(\ - Р) = 0,35(1 W1
• 0,35)
0,0025
= 91 преступление (дело, статкарта, приговор).
Если задать ошибку, равной ± 4%, то следует изучить 143 единицы, ± 3% - 225, ±296- 575 и т.д.
Из формулы W = J– , по которой
I П
определяется однократная
ошибка повторной выборки количественного признака, объем выборочной совокупности можно рассчитать после нахождения дисперсии (о2) и необходимой предельной ошибки выборки (W). Вновь обратимся к примеру о сроках лишения свободы. В нем а2 = = 2,29 года, W= ± 0,15 года. Найдем объем выборочной совокупности (/?):
2,29 0,0225
= 102 единицы.
Это означает, что если нас удовлетворяет ошибка выборки, равная ±0,15, то следует изучить 100 преступлений (дел, стат-карт и т. д.), а если она допустима в пределах ± 0,3, то достаточно 25 единиц изучения.
Выше говорилось, что коэффициент доверия, равный 1 (/=1), недостаточно надежен, так как только 683 единицы из 1000 могут быть в пределах заданной ошибки репрезентативности. Поэтому чаще всего при расчете объема выборочной совокупности вводится коэффициент доверия, равный 2 (/=2), который означает, что в 954 случаях из 1000 число единиц выборочной совокупности будет находиться в пределах заданной ошибки репрезентативности. С этой целью в приведенные формулы, как и при расчете ошибки репрезентативности, вводится коэффициент /.
Из формул предельных ошибок повторной выборки для качественных и количественных признаков выведем формулы расчета объемов выборочной совокупности.
132
Из д
следует и =
(качественные признаки).
Из д = /J– следует п = -~- (количественные признаки).
V и А
Принимая / = 2 и используя данные предыдущих примеров, определяем объемы выборочных совокупностей для качественных и количественных признаков:
, ч 0,35(1-0,35) 4 "*"
п (кач.) =-----^ пппг, '– -- 364 преступления;
и (колич.) =
2,29 4
= 407 преступлений.
0,0225
Расчеты выборочных совокупностей показывают, что если повысить коэффициент доверия вдвое (/=2), то объем выборки необходимо увеличить вчетверо, ^то означает, что в пределах тех же ошибок репрезентативности ± 5% и ± 0,15 года теперь будет находиться не 683, а 954 единицы из 1000. В этих случаях ошибка выборки именуется двукратной, поскольку распространяется на все единицы выборочной совокупности, расположенные в пределах 28 нормального распределения.
Все предшествующие расчеты производились для повторной выборки. В реальной жизни криминологические и социально-правовые изучения проводятся, как правило, бесповторным способом, т. е. уголовное дело, статкарта, гражданское дело и т. д. по какому-то признаку изучаются или респонденты (при анкетировании) опрашиваются единожды. В этом случае применяются формулы для бесповторной выборки.
Из д =
- – следует и =
Nt2P(\ - Р)
= –-------i-------'–-
+ t2P(\ - Р)
Л/ЬЧ
2,2
> = ',–1--7Г следует л = –
11 /1 I, N ) £f,, т, и
Эти формулы расчета выборочных совокупностей для качественных и количественных признаков являются наиболее полными. В них учтены коэффициент доверия, кратность предельной ошибки и бесповторность выборки. Пользуясь этими формулами, рассчитаем выборочные совокупности для известных данных.
133
Итак, дано:
Р (удельный вес признака)
А (предельная ошибка выборки)
/ (коэффициент доверия)
N (генеральная совокупность)
= 35 %, или 0,35;
= 5 %, или 0,05;
= 2;
– 5000.
п =
п (выборочная совокупность)
5000 • 4 • 0,35 • (1 - 0,35) _ 4600 O.OD25 5000 + 4 0,35 (1-0,35) ~ 13,42
= 343 преступления.
Если уменьшить ошибку выборки до ±3%, то выборочная совокупность должна быть увеличена до 848 единиц, если до ± 2 % – объем выборки должен составить 1575 единиц.
Второй пример решим применительно к количественному признаку.
Дано:
о2 (дисперсия) = 2,29 года;
Д (предельная ошибка выборки) = 0,15 года;
t (коэффициент доверия) = 2;
N (генеральная совокупность) = 3000.
(выборочная совокупность)
3000 4 2,29 27480
0,0225 3000 + 4 2,29 67,5 + 9,16
= 358 преступлений.
Увеличение генеральной совокупности вдвое, т. е. до 6000, увеличит выборку ненамного, лишь до 381 единицы. Это говорит о том, что объем генеральной совокупности – относительно второстепенный параметр даже при расчете объема бесповторной выборки, хотя он и стоит в формуле расчета. При повторной выборке объем генеральной совокупности не имеет никакого значения, поэтому он отсутствует в формуле расчета как дисперсии, так и численности выборки. Следовательно, там, где численность генеральной совокупности по тем или иным причинам точно не известна, ею можно пренебречь и рассчитывать выборочную совокупность по формулам повторной выборки или использовать приблизительную численность генеральной совокупности.
Для определения объема повторной выборки по качественному признаку можно использовать табл. 6. Как и табл. 5 (о пределах ошибок), она рассчитана применительно к коэффициенту доверия, равному 2 (/=2).
134
Таблица 6
Число наблюдений, необходимое для того, чтобы ошибка не превысила заданного предела (t=2)
Удельный вес
Предел ошибки, %
наблюдений, %
1
2
3
4
5
10
10 (90)
3600
900
400
230
150
37
15 (85)
5100
1300
570
320
210
52
20 (80)
6400
1600
710
400
260
65
25 (Z5i
75ПП
19ПП
аза
470
ям
76
30 (70)
8400
2100
930
530
340
85
35 (65)
9100
2300
1010
570
370
92
40 (60)
9600
2400
1070
600
390
97
45 (55)
9900
2500
1100
620
400
100
50 (50)
10 000
2500
1110
630
400
100
Примечание. Таблица приводится в сокращенном виде.
Предположим, что удельный вес изучаемого признака равен 25%. Находим этот показатель в первой графе табл. 6. Рассматривая строку (она подчеркнута), на которой находится 25% (75%), слева направо, мы увидим, что при заданной ошибке ± 1% численность выборки должна составить 7500 единиц, при ± 2% -1900, при ± 3% - 830, при ± 4% - 470, при + 5% - 300 единиц и т. д. Исходя из того, какая ошибка может быть признана допустимой при том или ином изучении, и определяется объем выборочной совокупности.
В криминологических и других социально-правовых исследованиях чаще всего бывает достаточной выборка до 300–400 единиц. Даже при максимальной колеблемости качественного признака 50% (дисперсия -- 0,25) предельная двукратная ошибка выборки составляет ±5%, при удельном весе признака 20% (80%) – ±4%, при удельном весе признака 10% (90%) – ± 3%.
«все книги «к разделу «содержание Глав: 77 Главы: < 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. >