Дискретное статистическое распределение


Статистическое распределение выборки

 

В дальнейшем под генеральной совокупностью мы будем подразумевать не само множество объектов, а множество значений случайной величины, принимающей числовое значение на каждом из объектов. В действительности генеральной совокупности как множества объектов может и не существовать. Например, имеет смысл говорить о множестве деталей, которые можно произвести, используя данный технологический процесс. Используя какие-то известные нам характеристики данного процесса, мы можем оценивать параметры этого несуществующего множества деталей. Размер детали – это случайная величина, значение которой определяется воздействием множества факторов, составляющих технологический процесс. Нас, например, может интересовать вероятность, с которой случайная величина принимает значение, принадлежащее некоторому интервалу. На данный вопрос можно ответить, зная закон распределения случайной величины, а также ее параметры, такие как математическое ожидание и дисперсия.

Итак, будем рассматривать генеральную совокупность как случайную величину X, закон распределения и параметры которой определяются с помощью выборочного метода.

Рассмотрим выборку объема n, представляющую данную генеральную совокупность. Первое выборочное значение x1 будем рассматривать как одно из возможных значений случайной величины X1, имеющей тот же закон распределения с теми же параметрами, что и случайная величина X. Второе выборочное значение x2 – одно из возможных значений случайной величины X 2 с тем же законом распределения, что и случайная величина X. То же самое можно сказать о значениях x3, x4,..., xn .

Таким образом, на выборку будем смотреть как на совокупность независимых случайных величинX1, X2, ..., X n, распределенных так же, как и случайная величинаX, представляющая генеральную совокупность.Выборочные значения x1,x2,..., xn – это значения, которые приняли данные случайные величины в результате 1-го,2-го,...,n-го эксперимента.

 

Пусть генеральная совокупность изучается с помощью некоторого признака или числовой характеристики, которую можно измерить (размер детали, удельное количество нитратов в арбузе, шум работы двигателя, количество бракованных изделий). Данная характеристика – случайная величина X, принимающая для каждой единицы определенное числовое значение. Из выборки объема n получаем значения данной случайной величины в виде ряда из n чисел: x1, x2,..., xn. Эти числа называются значениями признака или вариантами.

Если все значения признака упорядочить, т.е. расположить в порядке возрастания, то в результате получим вариационный ряд. При этом некоторые значения ряда могут повторяться. Выписав все различные значения признака xi и подсчитав, сколько раз данное значение встречается в выборке mi, получим таблицу, которая называется дискретнымстатистическим распределением (табл. 3.1). Число mi называется частотой i-го значения признака.

Таблица 3.1

Дискретное статистическое распределение

Варианты x1 x2 x3 ... xk
Частоты m1 m2 m3 ... mk

 

Очевидна также справедливость равенства .

Используя статистическое распределение, можно вычислить такие показатели, как относительная частота, накопленная частота, эмпирическая функция распределения:

wi = – относительная частота. В соответствии с законом больших чисел (теорема Бернулли) относительная частота при стремится к вероятности случайного события wipi.

mx – накопленная частота или число наблюдений в выборке, меньших либо равных х.

= выборочная или эмпирическая функция распределения случайной величины Х, вычисленная по выборке. Величина является относительной частотой попадания значений выборки левее точки х
в данной выборке, т.е. относительной частотой события (X < x). Иначе говоря, является выборочным аналогом функции распределения в генеральной совокупности.

Свойства эмпирической функции распределения:

1. 0 ≤ ≤ 1, следует из определения.

2. – неубывающая функция.

3. = 0, если .

4. = 1, если .

В точке функция увеличивается на величину wi и до следующего значения остается постоянной, затем в точке опять увеличивается на величину wi+1 и т.д. (рис. 3.1).

 

Рис. 3.1. График эмпирической функции распределения

 

Видно, что график эмпирической функции распределения напоминает график функции дискретного распределения вероятностей. Это не случайно: эмпирическую функцию распределения выборки можно рассматривать как функцию распределения вероятностей, где каждому значению , соответствует вероятность wi. Связь между и F(x) основана на теореме Бернулли, так же, как связь между относительной частотой события и его вероятностью. Поэтому если выборка репрезентативная, то F(x) при . Наглядное представление о дискретном статистическом распределении дает полигон частот (xi; ni) или полигон относительных частот (xi; wi) (рис. 3.2).

Рис. 3.2. Полигон распределения относительных частот

Пример 1. На втором курсе института теорию вероятностей изучают 690 студентов. Случайным образом выбрано 50 человек. На экзамене по теории вероятностей эти студенты получили следующие оценки:

8, 2 , 6, 5, 4, 5, 7, 6, 4, 3, 5, 5, 5, 4, 6, 7, 6, 6, 6, 3, 9, 8, 4, 4, 6, 7, 5, 5, 4, 3, 5, 5, 4, 3, 6, 6, 7, 7, 5, 4, 4, 5, 6, 3, 6, 6, 3, 4, 8, 6.

Необходимо:

1) построить вариационный ряд, вычислить относительные, накопленные частоты и значения эмпирической функции распределения;

2) построить полигон распределения относительных частот и график эмпирической функции распределения;

3) вычислить вероятность того, что оценка случайно выбранного студента окажется не менее семи.