Параметрів розподілу

Методи визначення інтервальних оцінок

 

Розглянемо формування довірчих інтервалів для основних числових характеристик розподілу.

Визначимо довірчий інтервал для математичного сподівання випадкової величини, що має у генеральній сукупності нормальний розподіл.

Оскільки випадкова величина є незсунутою точковою оцінкою математичного сподівання випадкової величини , то її закон розподілу має такі основні числові характеристики: та . Отже, формула (12.2) у цьому випадку набуває вигляду:

 

. (12.3)

 

Пронормуємо значення вибіркової середньої, що отримана за вибіркою обсягу :

 

, (12.4)

де – параметр генеральної сукупності, що підлягає оцінюванню, тобто математичне сподівання випадкової величини ;

– стандартна похибка вибіркової середньої:

. (12.5)

 

Випадкова величина , що отримана за формулою (12.4), має розподіл Стьюдента, кількість ступенів свободи якого становить .

Отже, задача полягає у тому, щоб визначити довірчий інтервал, до якого з довірчою ймовірністю % належатиме математичне сподівання випадкової величини . Довірча ймовірність відповідатиме площі під кривою – розподілу Стьюдента, що знаходиться між точками та . Якщо з формули (12.4) дістати значення випадкової величини , то для можна надати наступну графічну інтерпретацію довірчого інтервалу (рис. 12.1).

 

Рис. 12.1. Щодо побудови довірчого інтервалу

 

 

За формулою (12.4) з урахуванням співвідношення (12.5) отримуємо довірчий інтервал у вигляді:

 

. (12.6)

 

Формула (12.6) відповідає стандартній формі надання довірчого інтервалу для математичного сподівання.

З довірчою ймовірністю похибка , з якою математичне сподівання оцінюють за вибірковою середньою , не перевищує значення:

 

. (12.7)

 

Для вибіркових сукупностей невеликого обсягу значення знаходять за таблицею статистики Стьюдента відповідно до рівня значущості і кількості ступенів свободи .

Відомо, що із збільшенням розподіл Стьюдента наближається до нормального розподілу. Отже, випадкова величина при великих обсягах вибіркової сукупності розподілена за нормованим нормальним законом N (0; 1).

Таким чином для великих вибіркових сукупностей згідно з центральною граничною теоремою Ляпунова маємо:

 

, (12.8)

де – функція Лапласа, значення якої містяться у довідковій таблиці. Якщо позначити , то звідси:

. (12.8І)

 

У цьому випадку чинник визначається як аргумент функції Лапласа відповідно до умови:

 

. (12.9)

 

Слід зауважити, що хоча формули для визначення довірчого інтервалу математичного сподівання (12.6) та (12.8) дають, на перших погляд, один і той же результат, між ними існує принципова різниця. Так, півширина довірчого інтервалу за формулою (12.8) при заданому рівні значущості не залежить від обсягу вибірки, тоді як у формулі (12.6) величина залежить як від , так і від кількості ступенів свободи: .

Приклад. Керівництва фірми методом випадкового відбору з генеральної сукупності своїх працівників сформувала вибіркову сукупність обсягом 100 працівників і для них визначила середній стаж роботи. Він становив 8,7 роки, а середнє квадратичне відхилення дорівнювало 2,7 роки. Побудувати довірчий інтервал для середнього стажу роботи всіх співробітників, до якого він належатиме з надійністю 95%.

Розв’язання. Оскільки , то вибіркову сукупність можна вважати великою. Обчислимо довірчий інтервал за формулою (12.6). Так, , отже, за формулою (12.9) визначаємо, що . За довідковою таблицею знаходимо, що цьому значенню відповідає . Тепер визначаємо граничну похибку оцінки за вибіркою:

 

.

 

Значення граничної похибки віднімемо і додамо до вибіркової середньої: та . Відповідно, довірчий інтервал, до якого з надійністю 95% належатиме середній стаж співробітників фірми, становить від 8,1708 до 9,2292. Отже, можна записати співвідношення: .

 

Із співвідношення (12.7) випливає, що чим більше надійність оцінки, тим більше значення граничної похибки оцінювання, тобто тим менше точність оцінювання. Одночасно забезпечити збільшення точності статистичної оцінки і її надійності можна лише шляхом збільшення обсягу вибірки. Отже, виникає питання, як визначати обсяг вибіркової сукупності, що забезпечив би необхідну точність оцінювання при заданій її надійності. За формулою (12.7) маємо граничний обсяг вибірки:

 

, (12.10)

 

де – напівширина довірчого інтервалу, до якого з довірчою ймовірністю не менше за належатиме математичне сподівання випадкової величини, що розподілена за нормальним законом.

 

Приклад. Давайте за умовою попереднього прикладу визначимо, яким повинен бути обсяг вибіркової сукупності, щоб з надійністю 90% можна було б гарантувати, що середній стаж роботи усіх працівників фірми не виходить за межі від 8,4 роки до 9,0 років.

Розв’язання. Оскільки за умовою , то . За довідковою таблицею знаходимо, що . Відповідно, . Тоді за формулою (12.10) маємо:

 

.

 

Оскільки є натуральним числом, то виконання умов задачі можна забезпечити, якщо .

 

За формулою (12.6) можна також визначати істинне значення невідомої величини. На відміну від випадкової величини, яка може приймати різні значення, дана величина має одне значення, але воно невідомо, а відомості про нього и отримуємо шляхом її вимірювання у кількох дослідженнях. Тоді кількість досліджень має сенс обсягу вибірки, а значення , які отримані як результат вимірювань і які відрізняються одне від іншого в наслідок випадкових помилок, має сенс варіант. Оскільки невідома величина є сталою, а за властивістю математичного сподівання маємо, що математичне сподівання константи дорівнює самій константі. Отже, істинне значення невідомої величини дорівнює її математичному сподіванню. Відповідно, для її обчислення можна застосовувати формулу (12.6).

 

Приклад. Вартість одиниці того ж самого товару у різних дилерів надана у вигляді масиву:

 

10,5 12,0 14,5 10,0 12,5 11,0 14,5 12,0 13,0 12,5
14,5 10,5 11,5 12,5 14,0 13,0 11,0 13,5 12,5 11,0

 

Визначити з надійністю 95% істинну вартість одиниці товару, якщо вважати, що вона передбачає 10% прибутку від собівартості, а дилери встановлюють ціну, яка коливається навколо цієї істинної вартості.

Розв’язання. Вибіркова сукупність має обсяг , отже, це мала вибірка. Визначимо основні числові характеристики (пропонуємо зробити це самим): ; . Вводимо поправку на зсув и отримуємо виправлену дисперсію: . Звідси . Значення параметра визначаємо за статистикою Стьюдента для кількості ступенів свободи та рівня значущості . За довідковою таблицею маємо: (критична область є двостороннєю, оскільки передбачається, що відхилення від істинного значення може відбуватися як у бік більших, так і менших значень. Отже, гранично допустима похибка становить . Тепер за формулою (12.6) маємо, що істинне значення вартості одиниці товару з довірчою ймовірністю 95% належить проміжку .

Побудуємо довірчий інтервал для оцінки середнього квадратичного відхилення, до якого середнє квадратичне відхилення випадкової величини у генеральній сукупності належатиме з надійністю, не нижче певного рівня .

Припустимо, що випадкова величина має нормальний розподіл. Для побудови довірчого інтервалу введемо випадкову величину

 

,

 

яка розподілена за законом Пірсона з кількістю ступенів свободи .

Запишемо умову (12.2) у вигляді:

 

.

 

Після перетворень отримаємо довірчий інтервал, до якого дисперсії випадкової величини у генеральній сукупності належатиме з надійністю :

 

. (12.11)

 

Нижню і верхню межі довірчого інтервалу випадкової величини обчислюємо за довідковою таблицею за співвідношеннями:

 

; , де . (12.12)

 

Нагадаємо, що є випадковою величиною, що описується статистикою Пірсона з кількістю ступнів свободи .

 

Приклад. При дослідженні дальності приміських перевезень за певним маршрутом проводилось опитування 26 пасажирів. Виявилось, що середня дальність поїздки одного пасажира складає 24, 2 км, а середнє квадратичне відхилення – 12 км. Побудувати довірчий інтервал для середнього квадратичного відхилення з надійністю 90%.

Розв’язання. Оскільки довірча ймовірність дорівнює 0,9, то рівень значущості . Визначимо нижню і верхню межі довірчого інтервалу для випадкової величини за умовами (12.12). Отже, . Для числа ступенів свободи маємо, що . Для верхньої межі з умови маємо . За формулою (12.11) обчислюємо межі довірчого інтервалу для середнього квадратичного відхилення:

 

;

 

.

 

Отже, з надійністю 90% середнє квадратичне відхилення випадкової величини у генеральній сукупності знаходиться у межах:

 
 


.

 

Як вже зазначалось вище, оцінювання основних числових характеристик розподілу здійснюється у випадку, коли ознака, що досліджується, припускає кількісне вимірювання. Якщо ознака є якісною, то оцінюванню підлягає частка, яку становлять об’єкти з певними властивостями від загальної кількості об’єктів.

Побудуємо довірчий інтервал для ймовірності біноміального розподілу за вибірковою частістю. Нехай проводяться незалежні випробування, поява певної подій в кожному з них дорівнює . За законом великих чисел точковою оцінкою ймовірності є частість появи цієї події за результатами дослідження вибіркової сукупності обсягом . Оскільки для оцінка є незсунутою, то математичне сподівання випадкової величини повинно дорівнювати параметру, що оцінюється. Дійсно, провівши відповідні перетворення з урахуванням властивостей оператора математичного сподівання, а також того, що закон розподілу випадкової величини є біноміальним, отримуємо:

 

.

 

Визначимо дисперсію точкової оцінки, враховуючи властивості оператора дисперсії:

 

.

 

Звідси точковою оцінкою середнього квадратичного відхилення є

 

.

 

Для побудови довірчого інтервалу для математичного сподівання з надійністю скористуємося граничною теоремою для визначення ймовірності відхилення випадкової величини від її математичного сподівання.

 

.

 

При великому обсязі вибіркової сукупності для математичного сподівання випадкової величини згідно з центральною граничною теоремою Ляпунова маємо:

 

.

 

З урахуванням точкових оцінок отримуємо співвідношення:

 

. (12.13)

 

Позначимо аргумент функції Лапласа через . Його значення знаходять відповідно умові: . Отже, отримуємо:

 

. (12.14)

 

Пропустимо перетворення, що пов’язані з пошуком розв’язку квадратного рівняння і при великому обсязі вибірки отримаємо довірчий інтервал оцінки ймовірності, якщо закон розподілу є біноміальним:

 

. (12.15)

 

Приклад. При проведенні маркетингових досліджень визначалась стать покупців у відділу парфумів та косметики протягом одного дня. Виявилось, що серед 300 покупців лише 125 жінок. Побудувати довірчий інтервал для середньої кількості жінок серед загальної кількості покупців з надійністю 90%.

Розв’язання. За даними вибірки частість жінок серед покупців дорівнює . Оскільки обсяг вибірки великий, то для визначення довірчого інтервалу скористаємось формулою (12.15). За співвідношенням (12.14) маємо, що , тобто . Тоді гранична похибка оцінки ймовірності становить:

 

.

 

Отже, з надійністю 90% ймовірність того, що покупку у відділу парфумів здійснить жінка, належить проміжку: .