Дискретное статистическое распределение

Статистическое распределение выборки

В дальнейшем под генеральной совокупностью мы будем подразумевать не само множество объектов, а множество значений случайной величины, принимающей числовое значение на каждом из объектов. В действительности генеральной совокупности как множества объектов может и не существовать. Например, имеет смысл говорить о множестве деталей, которые можно произвести, используя данный технологический процесс. Используя какие-то известные нам характеристики данного процесса, мы можем оценивать параметры этого несуществующего множества деталей. Размер детали – это случайная величина, значение которой определяется воздействием множества факторов, составляющих технологический процесс. Нас, например, может интересовать вероятность, с которой случайная величина принимает значение, принадлежащее некоторому интервалу. На данный вопрос можно ответить, зная закон распределения случайной величины, а также ее параметры, такие как математическое ожидание и дисперсия.

Итак, будем рассматривать генеральную совокупность как случайную величину X, закон распределения и параметры которой определяются с помощью выборочного метода.

Рассмотрим выборку объема n, представляющую данную генеральную совокупность. Первое выборочное значение x₁ будем рассматривать как одно из возможных значений случайной величины X₁, имеющей тот же закон распределения с теми же параметрами, что и случайная величина X. Второе выборочное значение x₂ – одно из возможных значений случайной величины X ₂ с тем же законом распределения, что и случайная величина X. То же самое можно сказать о значениях x₃, x₄,..., x_n .

Таким образом, на выборку будем смотреть как на совокупность независимых случайных величинX₁, X₂, ..., X _n, распределенных так же, как и случайная величинаX, представляющая генеральную совокупность.Выборочные значения x₁,x₂,..., x_n – это значения, которые приняли данные случайные величины в результате 1-го,2-го,...,n-го эксперимента.

Пусть генеральная совокупность изучается с помощью некоторого признака или числовой характеристики, которую можно измерить (размер детали, удельное количество нитратов в арбузе, шум работы двигателя, количество бракованных изделий). Данная характеристика – случайная величина X, принимающая для каждой единицы определенное числовое значение. Из выборки объема n получаем значения данной случайной величины в виде ряда из n чисел: x₁, x₂,..., x_n. Эти числа называются значениями признака или вариантами.

Если все значения признака упорядочить, т.е. расположить в порядке возрастания, то в результате получим вариационный ряд. При этом некоторые значения ряда могут повторяться. Выписав все различные значения признака x_i и подсчитав, сколько раз данное значение встречается в выборке m_i, получим таблицу, которая называется дискретнымстатистическим распределением (табл. 3.1). Число m_i называется частотой i-го значения признака.

Таблица 3.1

Дискретное статистическое распределение

Варианты	x₁	x₂	x₃	...	x_k
Частоты	m₁	m₂	m₃	...	m_k

Очевидна также справедливость равенства .

Используя статистическое распределение, можно вычислить такие показатели, как относительная частота, накопленная частота, эмпирическая функция распределения:

w_i = – относительная частота. В соответствии с законом больших чисел (теорема Бернулли) относительная частота при стремится к вероятности случайного события w_i ≈ p_i.

m_x – накопленная частота или число наблюдений в выборке, меньших либо равных х.

= – выборочная или эмпирическая функция распределения случайной величины Х, вычисленная по выборке. Величина является относительной частотой попадания значений выборки левее точки х
в данной выборке, т.е. относительной частотой события (X < x). Иначе говоря, является выборочным аналогом функции распределения в генеральной совокупности.

Свойства эмпирической функции распределения:

1. 0 ≤ ≤ 1, следует из определения.

2. – неубывающая функция.

3. = 0, если .

4. = 1, если .

В точке функция увеличивается на величину w_i и до следующего значения остается постоянной, затем в точке опять увеличивается на величину w_i+₁ и т.д. (рис. 3.1).

Рис. 3.1. График эмпирической функции распределения

Видно, что график эмпирической функции распределения напоминает график функции дискретного распределения вероятностей. Это не случайно: эмпирическую функцию распределения выборки можно рассматривать как функцию распределения вероятностей, где каждому значению , соответствует вероятность w_i. Связь между и F(x) основана на теореме Бернулли, так же, как связь между относительной частотой события и его вероятностью. Поэтому если выборка репрезентативная, то → F(x) при . Наглядное представление о дискретном статистическом распределении дает полигон частот (x_i; n_i) или полигон относительных частот (x_i; w_i) (рис. 3.2).

Рис. 3.2. Полигон распределения относительных частот

Пример 1. На втором курсе института теорию вероятностей изучают 690 студентов. Случайным образом выбрано 50 человек. На экзамене по теории вероятностей эти студенты получили следующие оценки:

8, 2 , 6, 5, 4, 5, 7, 6, 4, 3, 5, 5, 5, 4, 6, 7, 6, 6, 6, 3, 9, 8, 4, 4, 6, 7, 5, 5, 4, 3, 5, 5, 4, 3, 6, 6, 7, 7, 5, 4, 4, 5, 6, 3, 6, 6, 3, 4, 8, 6.

Необходимо:

1) построить вариационный ряд, вычислить относительные, накопленные частоты и значения эмпирической функции распределения;

2) построить полигон распределения относительных частот и график эмпирической функции распределения;

3) вычислить вероятность того, что оценка случайно выбранного студента окажется не менее семи.

5rik.ru

Материалы для учебы и работы

Дискретное статистическое распределение

5rik.ru

Материалы для учебы и работы