Статистическая оценка выборки


Теоретической основой выборочного метода являются теория вероятностей и закон больших чисел. При случайном отборе единиц выборочной совокупности среднее значение изучаемого признака (доли) в выборочной совокупности стремится к характеристикам генеральной совокупности, то есть по величине среднего значения признака (доли) в выборочной совокупности можно судить о среднем значении этого признака (доли) в генеральной совокупности. Однако, вследствие наличия ошибок репрезентативности, значения генеральной и выборочной средней (доли) всегда различаются на величину ошибки выборки, которая не превосходит величины предельной ошибки выборки.

Предельную ошибку обычно представляют в виде

Δ = tμ,

где μ – средняя (стандартная) ошибка выборки,

t – коэффициент, связанный с доверительной вероятностью (коэффициент доверия), определяемый на основе интеграла Лапласа по заданной доверительной вероятности γ (см. Приложение 7):

Величина средней ошибки выборки зависит от объема выборки и объема генеральной совокупности (для бесповторной выборки) и соответствующих дисперсий, которые на практике обычно заменяют их выборочными оценками. Формулы для вычисления средней ошибки выборки разнятся в зависимости от вида выборки. Наиболее часто используемые из них приведены в табл. 3.2.

 

Способ формирования выборки Средняя ошибка выборочной средней Предельная ошибка выборочной средней
Случайный повторный
Случайный бесповторный
Механический
Типический
Серийный

 

где: μ– средняя ошибка выборки (репрезентативности);

∆х – предельная ошибка выборочной средней;

– дисперсия признака в генеральной совокупности;

– межсерийная дисперсия;

t – кратность ошибки;

n – численность выборки (ni – типической, nc – серийной);

N – численность генеральной совокупности (Ni – типической,

Nc – серийной);

– обследованная часть совокупности (доля выборки);

– необследованная часть совокупности.

Следует указать, что приведенные формулы являются некоторыми приближениями средних ошибок, так как в них соответствующие характеристики генеральной совокупности (например, генеральная дисперсия) заменены их выборочными оценками. Однако в большинстве практических задач такая замена неизбежна, так как требуемые параметры генеральной совокупности, как правило, неизвестны. А выборочное обследование может быть направлено на их оценку.

Для получения оценок с заданными точностью (Δ) и вероятностью (γ) требуется сформировать выборочную совокупность объема n (для собственно-случайной, механической и типической выборок) и m (для серийной), не меньшего некоторого числа, то есть определить минимальный объем выборки, при котором обеспечивается оценка с требуемыми свойствами. Формулы для определения необходимого объема для различных выборок следуют из соответствующих формул, представленных в табл. 3.2.

 

Способ формирования выборки Необходимая численность выборки
Случайный повторный
Случайный бесповторный
Механический
Типический
Серийный

 

где: ∆х – предельная ошибка выборочной средней;

– дисперсия признака в генеральной совокупности;

– межсерийная дисперсия;

t – кратность ошибки;

n – численность выборки (ni – типической, nc – серийной);

N – численность генеральной совокупности (Ni – типической,

Nc – серийной);

– обследованная часть совокупности (доля выборки);

– необследованная часть совокупности.

Следует иметь в виду, что числа, определяемые формулами табл. 3.3, как правило, не являются целыми, поэтому, чтобы получить величину объема выборки (целое число), необходимо к целой части полученного числа прибавить единицу, например, если получено 55,34, то объем равен 56, если 78,99, то 79.