Тема 6. Оценка независимой вероятности событий по частоте

§1. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона

Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (например, А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону A.

Проверка гипотезы о предполагаемом законе неизвестного распределения производится при помощи специально подобранной случайной величины — критерия согласия.

Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Имеется несколько критериев согласия: c2 («хи квадрат») К. Пирсона, Колмогорова, Смирнова и др. Рассмотрим применение критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство). С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.

A. Эмпирическое распределение задано в виде последовательности равноотстоящих вариант и соответствующих им частот.Пусть эмпирическое распределение задано в виде последовательности равноотстоящих вариант исоответствующих им частот:

Требуется, используя критерий Пирсона, проверить гипотезу о том, что генеральная совокупность X распределена нормально.

Правило 1. Для того чтобы при заданном уровне значимости a, проверить гипотезу о нормальном распределении генеральной совокупности, надо:

1. Вычислить непосредственно (при малом числе наблюдений) или упрощенным методом (при большом числе наблюдений), например методом произведений или сумм, выборочную среднюю и выборочное среднее квадратическое отклонение sB;

2. Вычислить теоретические частоты

где п объем выборки (сумма всех частот), h шаг (разность между двумя соседними вариантами),

3. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия

i ni ni - (ni - )2 (ni - )2/
å

 

б) по таблице критических точек распределения c2, по заданному уровню значимости a и числу степеней свободы k = s − 3 (sчисло групп выборки) находят критическую точку правосторонней критической области.

Если нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо (случайно). Если . гипотезу отвергают. Другими словами, эмпирические и теоретические частоты различаются значимо.

Замечание 1. Малочисленные частоты (ni < 5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы по формуле k = s − 3 следует в качестве s принять число групп выборки, оставшихся после объединения частот.

Б. Эмпирическое распределение задано в виде последовательности интервалов одинаковой длины и соответствующих им частот. Пусть эмпирическое распределение задано в виде последовательности интервалов (xi, xi+1) исоответствующих им частот ni (ni — сумма частот, которые попали в i-й интервал):

Требуется, используя критерий Пирсона, проверить гипотезу отом, что генеральная совокупность X распределена нормально.

Правило 2. Для того чтобы при уровне значимости a проверить гипотезу о нормальном распределении генеральной совокупности, надо:

1. Вычислить, например методом произведений, выборочную среднюю и выборочное среднее квадратическое отклонение sB, причем в качестве вариант принимают среднее арифметическое концов интервала:

.

2. Пронормировать X, т. е. перейти к случайной величине , и вычислить концы интервалов: , , причем наименьшее значение Z, т. е. z1, полагают равным ¥, а наибольшее, т. е. zs+1, полагают равным ¥.

3. Вычислить теоретические частоты

,

где п - объем выборки (сумма всех частот); Рi = Ф(zi+1) - Ф(zi) - вероятности попадания X в интервалы (xi, xi+1); Ф(Z) - функция Лапласа.

4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия Пирсона

б) по таблице критических точек распределения c2, по заданному уровню значимости a и числу степеней свободы k = s - 3 (s - число интервалов выборки) находят критическую точку правосторонней критической области .

Если - нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Если — гипотезу отвергают.

Замечание 2. Интервалы, содержащие малочисленные эмпирические частоты (пi < 5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле k = s - 3 следует в качестве s принять число интервалов, оставшихся после объединения интервалов.

§2. Проверка гипотезы о показательном распределении генеральной совокупности

Задано эмпирическое распределение непрерывной случайной величины X в виде последовательности интервалов xi - xi+1 . и соответствующих им частот пi, причем åпi = n (объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина X имеет показательное распределение.

Правило.Для того чтобы при уровне значимости a проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:

1. Найти по заданному эмпирическому распределению выборочную среднюю . Для этого, приняв в качестве «представителя» i-го интервала его середину составляют последовательность равноотстоящих вариант и соответствующих им частот.

2. Принять в качестве оценки параметра l показательного распределения величину, обратную выборочной средней:

3. Найти вероятности попадания X в частичные интервалы (xi , xi+1) по формуле

4. Вычислить теоретические частоты:

,

где n = åпi - объем выборки.

5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s - 2, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.

§3. Проверка гипотезы о распределении генеральной совокупности по биномиальному закону

Произведено п опытов. Каждый опыт состоит из N независимых испытаний, в каждом из которых вероятность появления события А одна и та же. Регистрируется число появлений события А в каждом опыте. В итоге получено следующее распределение дискретной случайной величины X - числа появлений события А (в первой строке указано число xi появлений события А в одном опыте; во второй строке - частота пi, т. е. число опытов, в которых зарегистрировано xi появлений события А):

Требуется, используя критерий Пирсона, проверить гипотезу о распределении дискретной случайной величины X по биномиальному закону.

Правило.Для того чтобы при уровне значимости a проверить гипотезу о том, что дискретная случайная величина X (число появлений события А) распределена по биномиальному закону, надо:

1. Найти по формуле Бернулли вероятности Рi появления ровно i событий А в N испытаниях (i = 0, 1, 2, ..., s, где s - максимальное число наблюдавшихся появлений события А в одном опыте, т. е. s ≤ N).

2. Найти теоретические частоты

,

где п - число опытов.

3. Сравнить эмпирические и теоретические частоты по критерию Пирсона, приняв число степеней свободы k = s - 1 (при этом предполагается, что вероятность р появления события А задана, т. е. не оценивалось по выборке и не производилось объединение малочисленных частот).

Если же вероятность р была оценена по выборке, то k = s - 2. Если, кроме того, было произведено объединение малочисленных частот, то s - число групп выборки, оставшихся после объединения частот.

§4. Проверка гипотезы о равномерном распределении генеральной совокупности

Задано эмпирическое распределение непрерывной случайной величины X в виде последовательности интервалов xi-1 - xi и соответствующих им частот пi, причем (объем åпi = n выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина X распределена равномерно.

Правило. Для того чтобы проверить гипотезу о равномерном распределении X, т. е. по закону

надо:

1. Оценить параметры а и b - концы интервала, в котором наблюдались возможные значения X, по формулам (через a* и b* обозначены оценки параметров):

2. Найти плотность вероятности предполагаемого распределения

3. Найти теоретические частоты:

4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s - 3, где s - число интервалов, на которые разбита выборка.

§5. Проверка гипотезы о распределении генеральной совокупности по закону Пуассона

Задано эмпирическое распределение дискретной случайной величины X. Требуется, используя критерий Пирсона, проверить гипотезу о распределении генеральной совокупности по закону Пуассона.

Правило.Для того чтобы при уровне значимости a проверить гипотезу о том, что случайная величина X распределена по закону Пуассона, надо:

1. Найти по заданному эмпирическому распределению выборочную среднюю.

2. Принять в качестве оценки параметра l распределения Пуассона выборочную среднюю l = .

3. Найти по формуле Пуассона (или по готовым таблицам) вероятности Pi появления ровно i событий в п испытаниях (i = 0, 1, 2, ..., r, где r - максимальное число наблюдавшихся событий; п - объем выборки).

4. Найти теоретические чистоты по формуле .

5. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s - 2, где s - число различных групп выборки (если производилось объединение малочисленных частот в одну группу, то s - число оставшихся групп выборки после объединения частот).

§6. Понятие о простейших случайных процессах

Определение. Случайным процессомX(t) называется процесс, значение которого при любом значении аргумента t является случайной величиной.

Другими словами, случайный процесс представляет собой функцию, которая в результате испытания может принять тот или иной конкретный вид, неизвестный заранее. При фиксированном t (t = t0) X(t0) представляет собой обычную случайную величину, т.е. сечение случайного процесса в момент t0.

Случайный процесс можно записать в виде функции двух переменных X(t, w), где w Î W, t Î T, X(t, w) Î X и w - элементарное событие, W - пространство элементарных событий, Т - множество значений аргумента t, X - множество возможных значений случайного процесса X(t, w).

Реализацией случайного процесса X(t, w) называется неслучайная функция x(t), в которую превращается случайный процесс X(t) в результате испытания (при фиксированном w), т.е. конкретный вид, принимаемый случайным процессом X(t), его траектория.

Таким образом, случайный процесс X(t, w) совмещает в себе черты случайной величины и функции. Если зафиксировать значение аргумента t, случайный процесс превращается в обычную случайную величину, если зафиксировать w, то в результате каждого испытания он превращается в обычную неслучайную функцию. В дальнейшем изложении опустим аргумент w, но он будет подразумеваться по умолчанию.

Пусть сечение случайного процесса при данном t является непрерывной случайной величиной. Тогда случайный процесс X(t) при данном t определяется плотностью вероятности j(х, t). Очевидно, что плотность j(х, t) не является исчерпывающим описанием случайного процесса X(t), т.к. она не выражает зависимости между его сечениями в разные моменты времени.

Случайный процесс X(t) представляет собой совокупность всех сечений при всевозможных значениях t, поэтому для его описания необходимо рассматривать многомерную случайную величину (X(t1), X(t2), ..., X(tn)), состоящую из всех сечений этого процесса. В принципе таких сечений бесконечно много, но для описания случайного процесса удается часто обойтись относительно небольшим количеством сечений.

Говорят, что случайный процесс имеет порядок п, если он полностью определяется плотностью совместного распределения j(х1, х2, ..., хп; t1, t2, ..., tn) n произвольных сечений процесса, т.е. плотностью n-мерной случайной величины (X(t1), X(t2), ..., X(tn)), где X(ti) - сечение случайного процесса X(t) в момент времени ti, i = 1, 2, ..., п.

Как и случайная величина, случайный процесс может быть описан числовыми характеристиками.

Математическим ожиданием случайного процесса X(t) называется неслучайная функция ax(t), которая при любом значении переменной t равна математическому ожиданию соответствующего сечения случайного процесса X(t), т.е. ax(t) = M[X(t)].

Дисперсией случайного процесса X(t) называется неслучайная функция Dx(t), при любом значении переменной t равная дисперсии соответствующего сечения случайного процесса X(t), т.е. Dx(t) = D[X(t)].

Средним квадратическим отклонением sx(t) случайного процесса X(t) называется арифметическое значение корня квадратного из его дисперсии, т.е.

Математическое ожидание случайного процесса характеризует среднюю траекторию всех возможных его реализаций, а его дисперсия или среднее квадратическое отклонение - разброс реализаций относительно средней траектории.

Корреляционной функцией случайного процесса X(t) называется неслучайная функция

Kx(t1, t2) = M[(X(t1) – ax(t1))(X(t2) – ax(t2))]

двух переменных t1 и t2, которая при каждой паре переменных t1 и t2 равна ковариации соответствующих сечений X(t1) и Х(t2) случайного процесса.

Очевидно, для случайного процесса X1(t) корреляционная функция убывает по мере увеличения разности t2 - t1 значительно медленнее, чем для случайного процесса X2(t).

Корреляционная функция Kx(t1, t2) характеризует не только степень тесноты линейной зависимости между двумя сечениями, но и разброс этих сечений относительно математического ожидания ax(t). Поэтому рассматривается также нормированная корреляционная функция случайного процесса.

Нормированной корреляционной функцией случайного процесса X(t) называется функция

Случайные процессы можно классифицировать в зависимости от того, плавно или скачкообразно меняются состояния системы, в которой они протекают, конечно (счётно) или бесконечно множество этих состояний и т.п. Среди случайных процессов особое место принадлежит марковскому процессу.