Определение необходимой (оптимальной) численности выборки
При разработке программы выборочного обследования одним из наиболее сложных является вопрос о том, сколько единиц изучаемой совокупности необходимо обследовать, т.е. об объеме выборки.
При этом следует иметь в виду, что при любом способе отбора предельная ошибка выборки обратно пропорциональна числу обследованных единиц. Т.е. средняя ошибка выборки пропорциональна , т.е. при увеличении численности выборки в 4 раза, ошибка уменьшится вдвое. Увеличивая n можно свести ошибку к min. При n®N, ®0.
Так как при проведении выборочного наблюдения определение характеристик выборки в ряде случаев сопровождается разрушением обследуемых образцов, то нормы отбора должны быть минимальны, так же не следует забывать об основном преимуществе несплошного наблюдения (минимум затрат и времени). Повышение процента выборки ведет к увеличению объема исследуемой работы. В то же время, если в выборку взять недостаточное количество проб, то результаты исследования будут содержать большие погрешности. Все это необходимо учитывать при организации выборочного обследования.
Определение необходимой численности выборки основывается на формуле предельной ошибки выборки (при повторном отборе).
Решаем это равенство относительно n, в результате получаем численность выборки при расчете средней величины количественного признака.
Для определения необходимой численности выборки должны быть заданы предельная ее ошибка и вероятность того, что эта ошибка не превысит заданного предела. В соответствии с этой вероятностью по таблице распределения находят коэффициент доверия t.
Наиболее сложно определить дисперсию изучаемого признака в генеральной совокупности. До проведения обследования приближенно оценить дисперсию или среднее квадратическое отклонение можно на следующей основе:
1. исходя из результатов специально организованного пробного обследования;
2. опираясь на данные предыдущих обследований, как выборочных, так и сплошных. Например, используя коэффициент вариации . Следовательно, дисперсия
3. исходя из закона распределения изучаемого признака в генеральной совокупности. Если распределение близко к нормальному, то размах вариации R в 6 раз больше среднего квадратического отклонения: R = 6s. В таком случае, зная максимальное и минимальное значения признака, можно оценить s: s=R/6
Если в результате выборочного обследования необходимо установить долю единиц, обладающих определенным значением альтернативного признака, то дисперсия для доли будет равна рq. В этом случае формула необходимой численности выборки примет вид:
Максимальное значение дисперсии альтернативного признака равно 0,25, т.е. max (pq) = 0,25 (при р = q -x*ользуя кямо ичество фаз, каждая из которых отличается подробностью программы наблюдениякими буквами, выборочные показатели, 0,5). Если доля единиц, обладающих изучаемым признаком, т.е. р, неизвестна, в расчете необходимой численности выборки можно использовать указанное максимальное значение для дисперсии альтернативного признака.
Формулы для нахождения необходимой численности выборки при разных способах отбора
Способ отбора | Оцениваемый параметр | Повторный отбор | Бесповторный отбор |
Собственно случайный и механический | Средняя | ||
Доля | |||
Типический | Средняя | ||
Доля | |||
Серийный | Средняя | ||
Доля |