Статистическая проверка гипотез

Министерство образования и науки Российской  Федерации

Федеральное агентство по образованию

Саратовский Государственный Технический Университет

Институт Развития Бизнеса и Стратегий

Кафедра ММЛ

КУРСОВАЯ РАБОТА

По дисциплине: «Статистика»

На тему: «Статистическая проверка гипотез»

Вариант 13

Выполнил: ст. гр.МНЖ-31

Проверил: Землянухин А.И.

Саратов 2010

Введение

Под статистической гипотезой понимается всякое высказывание о виде неизвестного распределения, или параметрах генеральной совокупности известных распределений, или о независимости выборок, которое можно проверить статистически, то есть опираясь на результаты наблюдений в случайной выборке.

Использование гипотез необходимо для развития любой отрасли науки: биологии, медицины, техники и др. В экономике сфера применения статистических гипотез ограничена. Это объясняется тем, что в естественных науках можно организовать эксперимент в виде случайной бесповторной выборки, в которой  отдельные наблюдения стохастически независимы. В экономике строгое выполнение этого условия порой невозможно.

В результате выполнения курсовой работы получаются  практические навыки определения характеристик случайной выборки и установления нормальности распределения случайной величины при заданном уровне значимости.

Нормальное распределение наиболее часто встречается в задачах управленческой и маркетинговой деятельности. Таким образом, предлагаемая курсовая работа содержит часть инструментария, необходимого современному экономисту и руководителю.

Условие задачи

Дано статистическое распределение выборки:

хi

x1

x2

x3

x4

x5

x6

x7

ni

5

13

20+(m+n)

30-(m+n)

19

10

3

Где  xi – результаты измерений, ni- частоты, с которыми встречаются значения xi . xi=0,2*m+0,3*(i-1)*n.

1.     Методом произведений найти выборочные: среднюю, дисперсию, среднее квадратическое отклонение.

2.     Построить нормальную кривую.

3.     Проверить гипотезу о нормальности Х при уровне значимости α=0,05.

Решение задачи

1 Найдем методом произведений выборочные: среднюю, дисперсию и среднее квадратическое отклонение. Воспользуемся методом произведений, для чего составляем таб.1

m=3; n=4.

хi

x1

x2

x3

x4

x5

x6

x7

ni

5

13

27

23

19

10

3

xi=0,2*m+0,3*(i-1)*n.

x1=0,2*3+0,3*(1-1)*4=0,6

x2=0,2*3+0,3*(2-1)*4=1,8

x3=0,2*3+0,3*(3-1)*4=3

x4=0,2*3+0,3*(4-1)*4=4,2

x5=0,2*3+0,3*(5-1)*4=5,4

x6=0,2*3+0,3*(6-1)*4=6,6

x7=0,2*3+0,3*(7-1)*4=7,8

хi

ni

ui

niui

niui2

ni (ui+1)2

0,6

5

-2

-10

20

5

1,8

13

-1

-13

13

0

3

27

0

0

0

27

4,2

23

1

23

23

92

5,4

19

2

38

76

171

6,6

10

3

30

90

160

7,8

3

4

12

48

75

n=∑ni=100

∑niui=80

∑ niui2=280

∑ ni (ui+1)2=530

В качестве ложного нуля принимаем С=3 – варианта  с наибольшей частотой 27. Шаг выборки h=x2-x1=1,8-0,6=1,2.  Тогда условные варианты определяем по формуле:

==

Подсчитываем условные варианты ui и заполняем все столбцы.

Последний столбец служит для контроля вычислений по тождеству:

∑ ni (ui+1)2=∑ niui2+2∑ niui+n.

Контроль: 530=270+2*80+100.

Вычисления произведены верно. Найдем условные моменты.

M1*===0,8;  M2*===2,8.

Вычисляем выборочную среднюю:

=M1* * h + C= 0,8*1,2+3=3,96

Находим выборочную дисперсию:

dB= [ M2*- (M1*)2]* h2= [2,8 - (0,8)2]*1,22=3,1

Определим выборочное среднее квадратическое отклонение:

σB===1,76

2 Строим нормальную кривую.

Для облегчения вычислений все расчеты сводим в таб.2

xi

ni

xi=xi−3,96

ui==

ni'=68,18*φ(ui)

0,6

5

-3,36

-1,90

0,0656

4

1,8

13

-2,16

-1,22

0,1895

13

3

27

-0,96

-0,54

0,3448

24

4,2

23

0,24

0,13

0,3918

28

5,4

19

1,44

0,81

0,2637

20

6,6

10

2,64

1,50

0,1295

9

7,8

3

3,84

2,18

0,0371

2

100

n==100

Заполняем первые три столбца.

В четвертом столбце записываем условные варианты по формуле, указанной в «шапке» таблицы. В пятом столбце находим значения функции:

Функции φ(ui) четная, т.е. φ(ui)= φ(-ui).

Значения функции φ(ui) в зависимости от аргумента ui (берутся положительные ui, т.к. функция  φ(ui) четная) находим из таблицы.

Теоретические частоты теоретической кривой находим по формуле:

=φ(ui)=68,18*φ(ui)

И заполняем последний столбец. Отметим, что в последнем столбце частоты  округляются до целого числа и .

В системе координат  строим нормальную (теоретическую) кривую по выравнивающим частотам  (они отмечены кружками) и полигон наблюдаемых частот (они отмечены крестиками). Полигон наблюдаемых частот построен в системе координат .

3 Проверим  гипотезу о нормальности Х при уровне значимости α=0,05.

Вычислим , для чего составим расчетную таблицу 3.

ni

5

4

1

1

0,25

25

6,25

13

13

0

0

0

169

13

27

24

3

9

0,38

729

30,38

23

28

-5

25

0,89

529

18,89

19

20

-1

1

0,05

361

18,05

10

9

1

1

0,11

100

11,11

3

2

1

1

0,5

9

4,5

100

100

X2наиб=2,18

102,18

                                                                                   

Суммируя числа пятого столбца, получаем  X2наиб=2,18

Суммируя числа последнего столбца, получаем 102,18.

Контроль: X2наиб=2,18

∑−∑ni =102,18−100= 2,18

Совпадение результатов подтверждает правильность вычислений.

Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариантов) 7. , где s- число различных значений xi.  , т.е r=2.υ = s−2=>υ = 7−2−1=4

По таблице критических точек распределения х2, по уровню значимости α=0,05 и числу степеней свободы ν=4 находим 9,5.

Так как   то нет оснований отвергать нулевую гипотезу. Другими словами, расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

Найдем доверительный интервал для оценки неизвестного МО М(Х), пологая, что Х имеет нормальное распределение, среднее квадратическое отклонение σ=σxB=1,76 и доверительная вероятность γ=0,95.

Известен объем выборки: n=100, выборочная средняя  

3,96.

Из соотношения 2Ф(t)= γ получим Ф(t)=0,475. По таблице находим параметр t=1,96.

Найдем точность оценки

δ =  = =0,34

Доверительный интервал таков:

Или 3,96-0,34<M(X)<3,96+0,34 3,62<M(X)<4,3.

Надежность γ=0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определят такие доверительные интервалы, в которых параметр действительно заключен