Методика обчислення теоретичних частот нормального розподілу 1 страница

Розглянемо один із способів обчислення теоретичних частот в припущенні, що генеральна сукупність розподілена нормально.

1. Весь інтервал спостережувальних значень Х вибірки обсягу ділять на частинних інтервалів . Знаходять середини частинних інтервалів . Одержуємо варіаційний ряд

...
...

 

2. Обчислюємо вибіркову середню і вибіркове середнє квадратичне відхилення .

3. Нормуємо випадкову величину Х, тобто переходимо до величини і обчислюємо кінці інтервалів

і . (15.7)

 

При цьому найменше значення , тобто , беруть рівним , а найбільше беруть рівним .

4. Обчислюємо теоретичні ймовірності попадання Х в інтервал за формулою

, (15.8)

 

де - функція Лапласа.

5. Обчислюємо шукані теоретичні частоти за формулою

 

. (15.9)

 

Приклад:

Обчислити теоретичні частоти за заданим інтервальним розподілом вибірки обсягу , припускаючи, що генеральна сукупність розподілена нормально.

№ п/п

 

Рішення

Результати розрахунків занесемо до таблиц 1

Таблиця 1

№ п/п
-1,05
-1,05 -0,16
-0,16 0,44
0,44 1,03
1,03
       

 

Знайдемо середню вибіркову:

Знайдемо вибіркове середнє квадратичне відхилення:

 

 

 

 

Нормуємо випадкову величину Х за формулами (15.7), результати обчислень запишемо у 8 і 9 стовпці таблиці 2.

Таблиця 2

№ п/п
- 0,5 - 0,3531 0,1469 20,566
- 0,3531 - 0,0636 0,2895 40,53
- 0,0636 0,1700 0,2336 32,704
0,1700 0,3485 0,1785 24,99
0,3485 0,5 0,1515 21,21
     

За таблицею функції Лапласа знаходимо значення , при цьому враховуємо, що є непарною функцією, тобто і для значень , (стовпці 2 і 3 продовження таблиці).

Обчислюємо теоретичні ймовірності за формулою (15.8) (стовпчик 4 продовження таблиці): .

Обчислюємо шукані теоретичні частоти за формулою (15.9) (стовпчик 5 продовження таблиці): .

Як бачимо,

 

Розділ 15.5. Завдання до заняття 15

Теоретичні питання до заняття 15

1. Дати означення статистичної гіпотези.

2. Дати означення нульової і конкуруючої гіпотези.

3. Дати означення статистичного критерія.

4. Дати означення критичної області і області прийняття нульової гіпотези.

5. Дати означення і пояснити алгоритм побудови правосторонньої критичної області.

6. Дати означення і пояснити алгоритм побудови лівосторонньої критичної області.

7. Дати означення і пояснити алгоритм побудови двосторонньої критичної області.

8. Сформулювати правило перевірки нульової гіпотези про рівність генеральних дисперсій нормальних сукупностей при конкуруючій гіпотезі .

9. Сформулювати правило перевірки нульової гіпотези про рівність генеральних дисперсій нормальних сукупностей, при конкуруючій гіпотезі .

10. Дати означення статистичного критерія згоди.

11. Сформулювати правило перевірки нульової гіпотези : генеральна сукупність має нормальний розподіл.

12. Сформулювати методику обчислення теоретичних частот.

 

Розділ 1.6. Поняття кореляції

При вивченні вищої математики користуються встановленими законами, однозначними залежностями одних величин від інших. Якщо кожному значенню змінної х за певним правилом або законом ставиться у відповідність одне певне значення змінної у , тоді говорять, що у є функцією від аргументу х і це записують як .

Але такі функціональні зв’язки мають обмежене розповсюдження. Особливо це стосується економічних, біологічних, суспільних явищ. Зміна даних явищ характеризується тим, що числовому значенню однієї ознаки відповідає не одна і та ж певна величина, а певна сукупність значень іншої, пов’язаної з нею ознаки. Так, чистий прибуток підприємства залежить не тільки від витрат на виробництво продукції і ціни на неї, але і від обсягів виробництва, можливості збуту виробленої продукції, її якісних показників тощо. Тому розглянутий зв’язок не може бути функціональним. Якщо числовому значенню деякого фактора х відповідає не конкретна величина, а групова середня результативного показника у , то таку залежність називають кореляційною.

Кореляційний зв’язок є не точна, а ймовірносна залежність однієї ознаки від іншої. Цей зв’язок має різну степінь точності, від повної незалежності до функціональної залежності.

Розділ 16.2. Метод найменших квадратів (загальні поняття)

Будь-які випадкові величини можуть бути пов’язані функціональною залежністю, що буває досить рідко, або залежністю іншого роду, яку називають статистичною, або будуть незалежними.

Означення:Статистичною називається залежність, при якій зміна однієї з величин веде до зміни розподілу іншої. Якщо зміна однієї з величин веде до зміни середнього значення іншої, тоді статистична залежність називається кореляційною.

При вивченні закономірностей в деяких дослідженнях інженерної справи, економіки, біології, медицини і т.п. приходиться аналітично описувати (у вигляді формули) зв'язок між двома змінними x та y. Для цього в процесі експериментів та спостережень вимірюють з можливою точністю окремі значення xi і відповідні їм значення yi ( i=1,2,…,n ), або отримують такі значення як статистичні дані. В результаті маємо таблицю значень.

 

x x1 x2 xi xn
y y1 y2 yi yn

 

Побудуємо у вибраній системі координат XOY точки Mi( xi, yi ), координати яких відповідають даним таблиці.

Тепер виникає необхідність вибору відповідної функції y=f(x), яка б описувала зв'язок між x і y. Таку функцію називають емпіричною. В загальному випадку вибір емпіричної функції не є однозначним. Можна знайти лінію, яка б проходила через кожну з точок Mi , це може бути так званий інтерполяційний багаточлен (на рис. 1 це пунктирна лінія), порядок якого буде досить високим (на одиницю меншим, ніж кількість точок в таблиці). Крім того, дані таблиці можуть бути не досить точними внаслідок наявності похибок вимірювання, а також впливу інших факторів, які ми не завжди можемо врахувати. Тому дослідники віддають перевагу більш простим і зручнішим функціям, таким, як лінійна , квадратична , показникові , гіперболічна і ін. Обрана функція повинна "найкращим" чином згладжувати експериментальні дані. В залежності від того, як вводиться поняття "найкраще згладжування" встановлюється той або інший метод вибору емпіричної залежності (на рис. 1 – суцільна лінія). Найбільш часто застосовується так званий метод найменших квадратів , який дозволяє знаходити параметри обраної залежності

Позначимо через відхилення емпіричної функції в точці від відповідного табличного (експериментального) значення . Зрозуміло (див. рис. 1 ), що можуть бути для одних додатніми, а для інших від'ємними. Тому їх сума може навіть дорівнювати нулю. Краще було б брати суму їх абсолютних величин але досліджувати суму, яка містить модулі величин складніше, ніж суму квадратів цих величин. Тому зупиняються на останньому

 

, (16.1)

 

де - теоретичне значення функції; - статистичне значення функції.

 
 

Параметри функції обирають так, щоб сума квадратів S приймала найменше значення.

 

Розділ 16.3. Побудова рівняння лінійної функції

Розглянемо випадок, коли є лінійною функцією з невідомими параметрами a i b. Тоді величина відхилення , а сума їх квадратів

. (16.2)

є функцією двох змінних a i b ( xi, yi – числа з таблиці). За необхідною умовою існування екстремуму, функція S (a,b) приймає мінімальне значення при тих значеннях a i b , при яких частинні похідні по цих змінних дорівнюють нулю, тобто коли

 

Із формули (16.2) знаходимо

 

Прирівнюючи до нуля частинні похідні, отримуємо систему рівнянь

 

(16.3)

 

Система (16.3) називається нормальною системою методу найменших квадратів.

Розв'язуючи систему рівнянь (16.3), знаходять числа a i b , які підставляють у рівняння що і дає формулу шуканої залежності.

Метод найменших квадратів був запропонований німецьким математиком К. Гауссом.

 

Приклад:

Статистичні дані чистого прибутку П підприємства і обсягів виробленої продукції наведено у вигляді таблиці.

 

П -1,32 -0,35 1,03 2,31 2,96 3,26 4,13 5,66 6,31 7,26
3,19 4,05 5,29 6,45 7,02 7,29 11,07 9,01 10,05 10,86

 

Припускаючи, що між змінними і П існує лінійна залежність, знайти емпіричну формулу за методом найменших квадратів.

 

Рішення

 

Складемо розрахункову таблицю.

 

X Y x**2 XY (Y) (Y)-y
-1,32 3,19 1,7424 -4,2108 3,324191 0,134191
-0,35 4,05 0,1225 -1,4175 4,219735 0,169735
1,03 5,29 1,0609 5,4487 5,493809 0,203809
2,31 6,45 5,3361 14,8995 6,675558 0,225558
2,96 7,02 8,7616 20,7792 7,275665 0,255665
3,26 7,29 10,6276 23,7654 7,552638 0,262638
4,13 11,07 17,0569 45,7191 8,355858 -2,71414
5,66 9,01 32,0356 50,9966 9,768417 0,758417
6,31 10,05 39,8161 63,4155 10,36852 0,318524
7,26 10,86 52,7076 78,8436 11,2456 0,385604
31,25 74,28 169,2673 298,2393 74,28 -8,4E-15

 

За формулою (16.3) знайдемо коефіцієнти рівняння прямої лінії регресії

 

 

За формулами Крамера знайдемо розв’язок системи

 

 

 

 

Таким чином, рівняння прямої лінії регресії набуде вигляду

 

 

За допомогою знайденого рівняння заповнимо два останні стовпці таблиці. Як видно із значення суми, рівняння знайдено правильно. На рисунку 2 представлено кореляційне поле, побудоване за статистичними даними, та рівняння прямої, побудоване за допомогою знайденого рівняння прямої лінії регресії.

Рис.2

Розділ 16.4. Побудова рівняння квадратичної функції

У випадку квадратичної функції за формулою (16.1) знаходимо мінімум суми як функції трьох змінних a, b, c, при яких частинні похідні її повинні дорівнювати нулю

 

 

Знаходимо частинні похідні функції

 

 

Прирівнюючи кожну з похідних до нуля отримуємо систему лінійних відносно a, b, c рівнянь

(16.4)

Приклад:

Статистичні дані витрат В підприємства і вкладень у модернізацію обладнання М наведено у вигляді таблиці.

М 3,5 4,1 4,5 4,2 5,5 5,7 6,3 7,5 8,0 8,0
В 13,0 8,5 6,5 5,0 3,3 2,9 2,9 5,2 7,0 9,1

 

Припускаючи, що між змінними В i М існує квадратична залежність, знайти емпіричну формулу за методом найменших квадратів.

 

Рішення

Для спрощення обчислень позначимо витрати В через змінну у, а вкладення в модернізацію М через змінну х та складемо розрахункову таблицю.

X (М) Y (В) x**2 х**3 х**4 XY х**2у (Y) (Y)-y
3,5 12,25 42,875 150,0625 45,5 159,25 12,04065471 -0,95935
4,1 8,5 16,81 68,921 282,5761 34,85 142,885 8,074138338 -0,42586
4,5 6,5 20,25 91,125 410,0625 29,25 131,625 6,016432497 -0,48357
4,2 17,64 74,088 311,1696 88,2 7,515713997 2,515714
5,5 3,3 30,25 166,375 915,0625 18,15 99,825 2,925402328 -0,3746
5,7 2,9 32,49 185,193 1055,6 16,53 94,221 2,65917934 -0,24082
6,3 2,9 39,69 250,047 1575,296 18,27 115,101 2,564476465 -0,33552
7,5 5,2 56,25 421,875 3164,063 292,5 5,542918124 0,342918
8,0305421 1,030542
9,1 72,8 582,4 8,0305421 -1,06946
57,3 63,4 353,63 2324,499 16055,89 351,35 2154,007 63,4 -1,3E-11

Використовуючи формулу (16.4) складемо систему для знаходження коефіцієнтів

 

 

Знайдемо розв’язок системи рівнянь за формулами Крамера

 

 

 

 

 

Тоді шукане рівняння набуде вигляду

 

 

За допомогою знайденого рівняння заповнимо два останні стовпці таблиці. Як видно із значення суми, рівняння знайдено правильно. На рисунку 3 представлено кореляційне поле, побудоване за статистичними даними, та рівняння параболи, побудоване за допомогою знайденого рівняння квадратичної лінії регресії.

 

Рис. 3

 

Розділ 16.5. Побудова рівняння гіперболічної функції

Вирівнювання дослідних даних за гіперболою здійснюється за допомогою заміни В такому разі в таблицю значень потрібно доповнити значеннями