Математическая статистика. Выборочный метод
Пусть требуется изучить некоторую совокупность однородных объектов.
Генеральная совокупность– это совокупность объектов, явлений или процессов, из которых производится выборка.
Выборочная совокупность(выборка) — это совокупность случайно отобранных объектов из генеральной совокупности.
Объем совокупности– это число объектов выборочной или генеральной совокупности.
Повторная выборка– это выборка, при которой отобранный случайным образом объект возвращается в генеральную совокупность перед отбором следующего объекта.
Бесповторная выборка– это выборка, при которой отобранный случайным образом объект больше в генеральную совокупность не возвращается. Одним из основных требований к формированию выборочных совокупностей является требование репрезентативностивыборки, т.е. для характеристики по данным выборочной совокупности интересующего исследователей признака генеральной совокупности необходимо, чтобы единицы выборки в достаточной степени обладали этим признаком.
Пусть из генеральной совокупности извлечена выборка, причем в ходе отбора значение изучаемого количественного признака X наблюдалось раз, значение – раза, значение – раз.
Объем выборки .
Наблюдаемые значения количественного признака называются вариантами,а число , показывающее, сколько раз наблюдалось значение , , называется частотой этого значения.
Последовательность вариант, записанных в возрастающем порядке, и соответствующих им частот называется вариационным рядом(или дискретным вариационным радом), и записывается в виде таблицы
… | |||
… |
Иногда вместо частот вариант записывают относительные частотывариант, то есть отношения частот кобъему выборки: , .
Если получено большое число данных, а в статистике оперируют, как правило, сотнями и тысячами значений, то их преобразуют в статистический ряд(или интервальный вариационный ряд).
Для этого промежуток между наименьшим и наибольшие наблюдаемыми значениями признака нужно разбить на несколько интервалов одинаковой длины и каждому интервалу поставить в соответствие количество вариант, попавших в этот интервал.
… | |||
… |
Здесь вместо количества попавших в интервал вариант можно писать относительные частоты попадания в соответствующий интервал , где – объем выборки.
Статистическим распределениемвыборки называется вариационный- ряд или интервальный вариационный ряд.
Графическое изображение вариационного ряда называется полигоном распределения (полигоном частот или полигоном относительных частот).
В пределе при полигон относительных частот дает многоугольник распределения.
Графическое изображение интервального вариационного ряда называется гистограммой распределения(гистограммой частот или гистограммой относительных частот).
Площадь гистограммы относительных частот равна 1.
Гистограмма относительных частот является статистическим аналогом плотности распределения вероятностей случайной величины.
Пусть X – изучаемый количественный признак, , , …, – имеющаяся выборка объема .Для произвольного действительного числа обозначим – количество вариант выборки, меньших числа х.
Относительная частота появления события (X < х)равна .
Функция ,определяющая для каждого (X < х) относительную частоту (X < х), называется эмпирической функцией распределения (или выборочной функцией распределения).
Функция распределения F(x)генеральной совокупности называется теоретической функцией распределения. Теоретическая функция распределения характеризует вероятность, со бытия (X < х), а эмпирическая функция характеризует относительную частоту данного события.
Эмпирическая функция распределения обладает всеми свойствами теоретической функции распределения F(x).
Пример 1. Имеется выборка значений случайной величины X: 2, 6, 12, 6, 6, 2, 6, 12, 12, 6, 6, 6, 12, 12, 6, 12, 2, 6, 12, 6 (n=20). Найти: 1) распределение относительных частот; 2) эмпирическую функцию распределения и построить ее график; 3) построить полигон относительных частот.
Решение. Вариационный ряд: 2, 2, 2, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 12, 12, 12, 12, 12, 12, 12.
Статистическое распределение выборки (распределение частот и относительных частот):
Значения | |||
Частоты | |||
Относительные частоты | 3/20 | 10/20 | 7/20 |
Эмпирическая функция распределения:
Полигон относительных частот имеет вид: