Определение необходимой (оптимальной) численности выборки

При разработке программы выборочного обследования одним из наиболее сложных является вопрос о том, сколько единиц изу­чаемой совокупности необходимо обследовать, т.е. об объеме вы­борки.

При этом следует иметь в виду, что при любом способе отбора предельная ошибка выборки обратно пропорциональна числу обследованных единиц. Т.е. средняя ошибка выборки пропорциональна , т.е. при увеличении численности выборки в 4 раза, ошибка уменьшится вдвое. Увеличивая n можно свести ошибку к min. При n®N, ®0.

Так как при проведении выборочного наблюдения определение характеристик выборки в ряде случаев сопровождается разрушением обследуемых образцов, то нормы отбора должны быть минимальны, так же не следует забывать об основном преимуществе несплошного наблюдения (минимум затрат и времени). Повышение процента выборки ведет к увеличению объема исследуемой работы. В то же время, если в выборку взять недостаточное количество проб, то результаты исследования будут содержать большие погрешности. Все это необходимо учитывать при организации выборочного обследования.

Определение необходимой численности выборки основывается на формуле предельной ошибки выборки (при повторном отборе).

Решаем это равенство относительно n, в результате получаем численность выборки при расчете средней величины количественного признака.

Для определения необходимой численности выборки должны быть заданы предельная ее ошибка и вероятность того, что эта ошибка не превысит заданного предела. В соответствии с этой вероятностью по таблице распределения находят коэффициент доверия t.

Наиболее сложно определить дисперсию изучаемого признака в генеральной совокупности. До проведения обследования приближенно оценить дисперсию или среднее квадратическое откло­нение можно на следующей основе:

1. исходя из результатов специально организованного пробного обследования;

2. опираясь на данные предыдущих обследований, как выборочных, так и сплошных. Например, используя коэффициент вариации . Следовательно, дисперсия

3. исходя из закона распределения изучаемого признака в гене­ральной совокупности. Если распределение близко к нормаль­ному, то размах вариации R в 6 раз больше среднего квадратического отклонения: R = 6s. В таком случае, зная максимальное и минимальное значения признака, можно оценить s: s=R/6

Если в результате выборочного обследования необходимо ус­тановить долю единиц, обладающих определенным значением альтернативного признака, то дисперсия для доли будет равна рq. В этом случае формула необходимой численности выборки при­мет вид:

Максимальное значение дисперсии альтернативного признака равно 0,25, т.е. max (pq) = 0,25 (при р = q -x*ользуя кямо ичество фаз, каждая из которых отличается подробностью программы наблюдениякими буквами, выборочные показатели, 0,5). Если доля единиц, обладающих изучаемым признаком, т.е. р, неизвестна, в расчете необходимой численности выборки можно использовать указанное максимальное значение для дисперсии альтернативного признака.

Формулы для нахождения необходимой численности выборки при разных способах отбора

Способ отбора Оцениваемый параметр Повторный отбор Бесповторный отбор
Собственно случайный и механи­ческий Средняя
Доля
Типический Средняя
Доля
Серийный Средняя
Доля