Дискретное статистическое распределение
Статистическое распределение выборки
В дальнейшем под генеральной совокупностью мы будем подразумевать не само множество объектов, а множество значений случайной величины, принимающей числовое значение на каждом из объектов. В действительности генеральной совокупности как множества объектов может и не существовать. Например, имеет смысл говорить о множестве деталей, которые можно произвести, используя данный технологический процесс. Используя какие-то известные нам характеристики данного процесса, мы можем оценивать параметры этого несуществующего множества деталей. Размер детали – это случайная величина, значение которой определяется воздействием множества факторов, составляющих технологический процесс. Нас, например, может интересовать вероятность, с которой случайная величина принимает значение, принадлежащее некоторому интервалу. На данный вопрос можно ответить, зная закон распределения случайной величины, а также ее параметры, такие как математическое ожидание и дисперсия.
Итак, будем рассматривать генеральную совокупность как случайную величину X, закон распределения и параметры которой определяются с помощью выборочного метода.
Рассмотрим выборку объема n, представляющую данную генеральную совокупность. Первое выборочное значение x1 будем рассматривать как одно из возможных значений случайной величины X1, имеющей тот же закон распределения с теми же параметрами, что и случайная величина X. Второе выборочное значение x2 – одно из возможных значений случайной величины X 2 с тем же законом распределения, что и случайная величина X. То же самое можно сказать о значениях x3, x4,..., xn .
Таким образом, на выборку будем смотреть как на совокупность независимых случайных величинX1, X2, ..., X n, распределенных так же, как и случайная величинаX, представляющая генеральную совокупность.Выборочные значения x1,x2,..., xn – это значения, которые приняли данные случайные величины в результате 1-го,2-го,...,n-го эксперимента.
Пусть генеральная совокупность изучается с помощью некоторого признака или числовой характеристики, которую можно измерить (размер детали, удельное количество нитратов в арбузе, шум работы двигателя, количество бракованных изделий). Данная характеристика – случайная величина X, принимающая для каждой единицы определенное числовое значение. Из выборки объема n получаем значения данной случайной величины в виде ряда из n чисел: x1, x2,..., xn. Эти числа называются значениями признака или вариантами.
Если все значения признака упорядочить, т.е. расположить в порядке возрастания, то в результате получим вариационный ряд. При этом некоторые значения ряда могут повторяться. Выписав все различные значения признака xi и подсчитав, сколько раз данное значение встречается в выборке mi, получим таблицу, которая называется дискретнымстатистическим распределением (табл. 3.1). Число mi называется частотой i-го значения признака.
Таблица 3.1
Дискретное статистическое распределение
Варианты | x1 | x2 | x3 | ... | xk |
Частоты | m1 | m2 | m3 | ... | mk |
Очевидна также справедливость равенства .
Используя статистическое распределение, можно вычислить такие показатели, как относительная частота, накопленная частота, эмпирическая функция распределения:
wi = – относительная частота. В соответствии с законом больших чисел (теорема Бернулли) относительная частота при
стремится к вероятности случайного события wi ≈ pi.
mx – накопленная частота или число наблюдений в выборке, меньших либо равных х.
=
– выборочная или эмпирическая функция распределения случайной величины Х, вычисленная по выборке. Величина
является относительной частотой попадания значений выборки левее точки х
в данной выборке, т.е. относительной частотой события (X < x). Иначе говоря, является выборочным аналогом функции распределения
в генеральной совокупности.
Свойства эмпирической функции распределения:
1. 0 ≤ ≤ 1, следует из определения.
2. – неубывающая функция.
3. = 0, если
.
4. = 1, если
.
В точке функция
увеличивается на величину wi и до следующего значения
остается постоянной, затем в точке
опять увеличивается на величину wi+1 и т.д. (рис. 3.1).
Рис. 3.1. График эмпирической функции распределения
Видно, что график эмпирической функции распределения напоминает график функции дискретного распределения вероятностей. Это не случайно: эмпирическую функцию распределения выборки можно рассматривать как функцию распределения вероятностей, где каждому значению
, соответствует вероятность wi. Связь между
и F(x) основана на теореме Бернулли, так же, как связь между относительной частотой события и его вероятностью. Поэтому если выборка репрезентативная, то
→ F(x) при
. Наглядное представление о дискретном статистическом распределении дает полигон частот (xi; ni) или полигон относительных частот (xi; wi) (рис. 3.2).
Рис. 3.2. Полигон распределения относительных частот
Пример 1. На втором курсе института теорию вероятностей изучают 690 студентов. Случайным образом выбрано 50 человек. На экзамене по теории вероятностей эти студенты получили следующие оценки:
8, 2 , 6, 5, 4, 5, 7, 6, 4, 3, 5, 5, 5, 4, 6, 7, 6, 6, 6, 3, 9, 8, 4, 4, 6, 7, 5, 5, 4, 3, 5, 5, 4, 3, 6, 6, 7, 7, 5, 4, 4, 5, 6, 3, 6, 6, 3, 4, 8, 6.
Необходимо:
1) построить вариационный ряд, вычислить относительные, накопленные частоты и значения эмпирической функции распределения;
2) построить полигон распределения относительных частот и график эмпирической функции распределения;
3) вычислить вероятность того, что оценка случайно выбранного студента окажется не менее семи.