Математическая статистика. Выборочный метод

Пусть требуется изучить некоторую совокупность однородных объектов.

Генеральная совокупность– это совокупность объек­тов, явлений или процессов, из которых производится вы­борка.

Выборочная совокупность(выборка) — это совокуп­ность случайно отобранных объектов из генеральной сово­купности.

Объем совокупности– это число объектов выборочной или генеральной совокупности.

Повторная выборка– это выборка, при которой отобран­ный случайным образом объект возвращает­ся в генеральную совокупность перед отбором следующе­го объекта.

Бесповторная выборка– это выборка, при кото­рой отобранный случайным образом объект больше в гене­ральную совокупность не возвращается. Одним из основных требований к формированию выборочных совокупностей яв­ляется требование репрезентативностивыборки, т.е. для ха­рактеристики по данным выборочной совокупности интере­сующего исследователей признака генеральной совокупности необходимо, чтобы единицы выборки в достаточной степени обладали этим признаком.

Пусть из генеральной совокупности извлечена выборка, причем в ходе отбора значение изучаемого количественного признака X наблюдалось раз, значение раза, зна­чение раз.

Объем выборки .

Наблюдаемые значения количественного признака назы­ваются вариантами,а число , показывающее, сколько раз наблюдалось значение , , называется частотой этого значения.

Последовательность вариант, записанных в возрастающем порядке, и соответствующих им частот называется вариаци­онным рядом(или дискретным вариационным радом), и записывается в виде таблицы

     
     

 

Иногда вместо частот вариант записывают относительные частотывариант, то есть отношения частот кобъему выборки: , .

Если получено большое число данных, а в статистике оперируют, как правило, сотнями и тысячами значений, то их преобразуют в статистический ряд(или интервальный вариационный ряд).

Для этого промежуток между наименьшим и наибольшие наблюдаемыми значениями признака нужно разбить на несколько интервалов одинаковой длины и каждому интервалу поставить в соответствие количество вариант, попавших в этот интервал.

   
     

Здесь вместо количества попавших в интервал вариант можно писать относительные частоты попадания в соответст­вующий интервал , где – объем выборки.

Статистическим распределениемвыборки называется вариационный- ряд или интервальный вариационный ряд.

Графическое изображение вариационного ряда называется полигоном распределения (полигоном частот или полигоном относительных частот).

В пределе при полигон относительных частот дает многоугольник распределения.

Графическое изображение интервального вариационного ряда называется гистограммой распределения(гистограм­мой частот или гистограммой относительных частот).

Площадь гистограммы относительных частот равна 1.

Гистограмма относительных частот является статистическим аналогом плотности распределения вероятностей случайной величины.

Пусть X – изучаемый количественный признак, , , …, имеющаяся выборка объема .Для произвольного действительного числа обозначим – количество вариант выборки, меньших числа х.

Относительная частота появления события (X < х)равна .

Функция ,определяющая для каждого (X < х) относительную частоту (X < х), называется эмпири­ческой функцией распределения (или выборочной функцией распределения).

Функция распределения F(x)генеральной совокупности называется теоретической функцией распределения. Теоретическая функция распределения характеризует вероятность, со бытия (X < х), а эмпирическая функция характеризует относительную частоту данного события.

Эмпирическая функция распределения обладает всеми свойствами теоретической функции распределения F(x).

Пример 1. Имеется выборка значений случайной величины X: 2, 6, 12, 6, 6, 2, 6, 12, 12, 6, 6, 6, 12, 12, 6, 12, 2, 6, 12, 6 (n=20). Найти: 1) распределение относительных частот; 2) эмпирическую функцию распределения и построить ее график; 3) построить полигон относительных частот.

Решение. Вариационный ряд: 2, 2, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 12, 12, 12, 12, 12, 12, 12.

Статистическое распределение выборки (распределение частот и относительных частот):

Значения
Частоты
Относительные частоты 3/20 10/20 7/20

Эмпирическая функция распределения:

 

Полигон относительных частот имеет вид: