Вопрос 4.
Способы отбора.
Бесповторный
Повторный
Различают
При повторном способе отбора отобранные из генеральной совокупности единицы исследуются и возвращаются в генеральную совокупность. И, через некоторые промежуток времени, могут опять участвовать в выборочном исследовании. Например, при контрольном взвешивании животных на выращивании и откорме одни и те же животные могут попадать в исследование через некоторый промежуток времени.
При бесповторном наблюдении отобранные для наблюдения единицы или уничтожаются, или не возвращаются в генеральную совокупность, или просто не могут снова участвовать в выборочном исследовании. Например, при анализе цен на сельскохозяйственную продукцию на крупных рынках областных центров невозможно повторное исследование одной и той же совокупности, так как она все время меняется. При исследовании качественных показателей сельскохозяйственной продукции отобранные для исследования единицы не возвращаются в генеральную совокупность и не могут снова участвовать в выборочном исследовании.
Виды выборки:
1) Собственно-случайный (жеребьевка и лотерейный) вид отбора. Например, метровую рамку накладываем на всходы на поле случайным образом.
2) Механический. Этот вид чаще используется в промышленности там, где есть поточная линия и можно для оценки качества изделий отбирать каждое 10-е (50-е, 100-е и т.д.) изделие.
3) Типический, или районированный вид. Этот вид выборки чаще всего используется при анализе технико-экономических показателей в хозяйствах различных регионов, отличающихся по природно-климатическим условиям.
4) Серийно-гнездовой вид отбора чаще всего в сельском хозяйстве используется в растениеводстве, где проводят серию опытов или в животноводстве при групповом содержании животных
5) Комбинированный вид отбора. Как правило, виды выборки в чистом виде встречаются редко и их чаще всего используют в комбинации друг с другом.
Способы совмещаются с видами.
Основной принцип отбора:
1) Обеспечение случайности, т.е. при отборе все единицы генеральной совокупности имеют равную возможность попасть в выборку.
2) Обеспечение достаточного числа отобранных единиц, т.е. репрезентативности выборки.
Теоретические основы выборочного наблюдения сформировались в трудах петербургской математической школы – П.Ч.Чебышева (1821–1894), А.М.Ляпунова (1857–1918), А.А.Маркова (1856–1922).В 1901 году русский экономист и статистик В.И.Борткевич (1863–1931) указал, что теоретической основой выборочного метода должно служить исчисление вероятностей. [3]
В современной статистикесчитается, что результатами выборочного наблюдения можно пользоваться, если решены три вероятностные задачи:
1. Если определены возможные пределы ошибки репрезентативности с заданной вероятностью. Если эти пределы больше заданных, то такими результатами пользоваться нельзя.
2. Если определена вероятность "p" того, что возможные пределы ошибки репрезентативности не превосходят заданных величин. При недостаточной вероятности тоже нельзя пользоваться результатами выборочного наблюдения.
3. Необходимо решить вопрос о том, каким должен быть объем выборки "n" для того, чтобы получить результаты с заранее заданной точностью, и чтобы можно было гарантировать эту точность с заранее заданной вероятностью.
Решение всех трех задач обеспечивается теоремой П.Л. Чебышева:
,
где e и h – как угодно малые величины, а объем выборки "n" – достаточно большое число.
Но поскольку при проведении выборочного наблюдения возможно получить много различных значений , то ответ на вопрос, когда можно пользоваться выборочным наблюдением, дает теорема А.М. Ляпунова:
Теорема:
Случайная переменная величина, состоящая из большого числа взаимно независимых слагаемых, среди которых нет ни одного, резко выдающегося своей колеблемостью, имеет нормальное распределение.
На практике это позволяет принимать равенство дисперсий в выборочной и генеральной совокупностях:
Здесь не важно, какое распределение в генеральной совокупности. Главное, чтобы выборка была распределена нормально. При этом вероятность "P" того, что ошибка выборочной средней "∆" не превысит среднюю ее ошибку (среднее квадратическое отклонение)
±s – равна P=0,68269
±2s – P=0,95450
±3s – P=0,99730
Коэффициент при среднем квадратическом отклонении "s", показывающий кратность средней ошибки выборки, обозначается "t" и называется коэффициентом доверия. Связь между вероятностью "P" и коэффициентом доверия "t" выражается интегралом:
Величина D=s называется средней или стандартной ошибкой выборки.
Произведение ts называется предельной ошибкой выборки.
Можно доказать, что предельная ошибка выборки может быть найдена по формуле (1),
Из формулы (1) видно, что предельная ошибка "D" зависит от трех факторов:
1) от силы вариации анализируемого показателя, что отражается в виде дисперсии "s2", причем, чем выше сила вариации, тем больше ошибка;
2) от объема выборки "n", причем, чем боше объем выборки, тем меньше ошибка;
3) от значения коэффициента доверия "t", который связан со значением вероятности Р.
Значение предельной ошибки Dx зависит не только от объема выборки n, но и от доли выборки относительно объема N генеральной совокупности.
Величина зависит только от того, с какой вероятностью необходимо гарантировать пределы ошибки выборки. Значения коэффициента доверия t и вероятности Р находят по таблицам нормального закона распределения (таблицам Муавра–Лапласа), которые как правило есть в учебниках статистики и теории вероятностей.
Если известны дисперсия s2 и коэффициент доверия t, то из формулы (1) можно получить формулу для расчета объема выборочной совокупности
(2)
На основании формул (1) и (2) решаются все три поставленные задачи.
Для доли выборки эти формулы трансформируются:
; (3)
Вопрос 5.
Формулы (1), (2) и (3) используются для оценки результатов исследования при проведении случайного повторного отбора. Для всех остальных видов и способов отбора единиц из генеральной совокупности в выборочную оценку показателей можно производить по формулам, взятым из следующей таблицы. Все эти формулы являются математической трансформацией предыдущих трех.
Таблица
Формулы для оценки результатов выборочного исследования
Способ отбора | Ошибка (предельная) выборки | Объем выборки | Примечание |
Случайный бесповторный | – | ||
Серийно-гнездовой бесповторный | nсер. – число отобранных серий | - средняя по каждой серии - общая средняя | |
Типический бесповторный | - средняя дисперсия из частных внутри групповых (остаточных) дисперсий |