Выборочный метод
Фундаментальные понятия статистической теории – генеральная и выборочная совокупности.
Генеральная совокупность – это множество всех однородныхобъектов, подлежащих изучению.
Выборочной совокупностью, или выборкой, называется некоторое множество объектов случайно отобранных из генеральной совокупности.
Объёмом совокупности называется число её объектов.
Например, если из 10000 изготовленных деталей для обследования отобрано 100, то объём генеральной совокупности N=10000, а выборки – n=100.
Выборка должна быть репрезентативной (представительной), т.е. такой, по которой можно уверенно судить об интересующем признаке всей генеральной совокупности. Выборка будет репрезентативной, если её осуществить случайным образом.
Пусть для изучения некоторого признака проводятся независимые испытания (наблюдения) в одинаковых условиях, в результате которых получены определённые числовые значения х1, х2, …, хп (п – объём выборки). Если эти значения разместить в порядке возрастания, то полученная возрастающая последовательность наблюдаемых значений будет называться дискретным вариационным рядом, а сами отдельные значения – вариантами.
Если имеются равные варианты, то дискретный ряд будет состоять из х1, х2, …, хk вариант, каждая из которых будет характеризоваться своей частотой появления
п1, п2, …, пk, причём в сумма всех частот появления вариант будет равна объёму выборки:
п1+ п2+ …+пk=п.
Относительная частота варианты – отношение её частоты к объёму выборки: wi=ni/n.
Сумма относительных частот всех вариант равна единице: .
Статистическое распределение выборки представляет собой соответствие между вариантами и их относительными частотами, которое для наглядности может быть построено на графике.
Если изучаемый признак является непрерывной величиной, то вариационный ряд будет интервальным. Например, имеются результаты измерений непрерывной случайной величины Х, для которой а – наименьшее значение, а b – наибольшее. В процессе обработки результатов отрезок разбивается на k элементарных отрезков, подсчитываются ni – число значений величины Х на каждом из этих интервалов (хi-xi-1).
Разности между двумя значениями случайной величины, образующих элементарный отрезок (хi-xi-1), называются интервальными промежутками.
Формируется интервальный вариационный ряд, подсчитываются относительные частоты случайной величины на каждом интервале ni/(хi-xi-1).
Разность между наибольшим (b) и наименьшим значениями случайной величины (а) называется размахом вариации.
Вариационный ряд является наиболее простым при равенстве интервальных промежутков.
Для наглядности может строиться гистограмма частот(см. рис.3). Это – ступенчатая фигура, состоящая из прямоугольников с основаниями равными интервальным промежуткам и высотами равными плотностям относительных частот на каждом промежутке (отношение относительной частоты случайной величины на каждом интервале к интервальному промежутку – wi/(хi-xi-1)).
Площадь такой гистограммы равна сумме относительных частот случайной величины, т.е. единице.
Для выборной совокупности по формуле Fn(х)=nx/n рассчитывается эмпирическая функция распределенияили функция распределения выборки. Здесь n – объём выборки, а nx – число вариант, для которых Х<x.
Функция распределения выборки Fn(х) отличается от теоретической функции распределения (функции распределения генеральной совокупности) F(х) тем, что первая определяет относительную частоту события, для которых Х<х, а вторая – вероятность того же события.
Например: требуется найти функцию распределения следующей выборки
варианты хi | ||||
частоты ni |
Объём выборки: п=2+3+10+5=20.
Наименьшая варианта х1=6, поэтому для Х<6 функция распределения выборки Fn(х)=0/20=0.Для Х£8, Fn(х)=2/20=0,1; Х£12 – Fn(х)=5/20=0,25; Х£15 – Fn(х)=15/20=0,75. Наибольшая варианта х4=15, поэтому для Х>15 функция распределения выборки Fn(х)=20/20=1. График эмпирической функции распределения для этой выборки будет иметь следующий вид.
Рис.7 График функции распределения выборки дискретной случайной величины
По выборке можно судить о значении какого-либо параметра генеральной совокупности. Оценка исследуемого параметра будет качественной при условии, что она удовлетворяет требованиям несмещённости, состоятельностииэффективности.
Например, требуется оценить некоторый параметр a генеральной совокупности по выборке х1, х2, …, хп. Оценка этого параметра будет зависеть от значений х1, х2, …, хп и обозначаться: . Величина является случайной величиной, поэтому она характеризуется распределением и числовыми характеристиками распределения.
Оценка параметра a считается несмещённой, если её математическое ожидание, определённое по выборочной совокупности, равно истинному значению этого параметра: М()=a и – смещённой при М()¹a.
Оценка параметра a является состоятельной, если по мере увеличения объёма выборки оценка будет приближаться к оцениваемому параметру с вероятностью, стремящейся к единице. Это означает, что при любом e>0 . Это равенство выполняется при условии, что .
Оценка параметра a является эффективной, если при заданном п она имеет наименьшую дисперсию D()=Dmin, т.е. средний квадрат ошибки данной оценки не превышает среднего квадрата ошибки при любой другой оценке: .