Методи перевірки гіпотез про закони розподілу випадкових величин
Статистичні гіпотези - це припущення, котрі відносяться до виду розподілу випадкової величини або окремих його параметрів. Оцінка відповідності статистичної гіпотези дослідним даним проводиться за допомогою статистичного критерію, який є стандартним прийомом оцінки відповідності висунутої гіпотези результатам спостереження. Задача випробовування статистичних гіпотез виникає і тоді, коли обставини вимушують нас робити вибір між двома способами дії. Для визначення виду функції розподілу густини ймовірності та оцінювання параметрів по емпіричним законам формулюється нульова гіпотеза (Н0) про "відсутність розбіжностей". Нульова гіпотеза є прикладом статистичного висновку: якщо нульову гіпотезу відкинути, то висновок полягає в тому, що у сукупності, котра розглядається є розбіжності, тобто приймається альтернативна гіпотеза Н1.
Приймемо, що випадкова величина підпорядкована закону розподілу з густиною ймовірності -нульова гіпотеза. У випадку, якщо виявиться, що гіпотеза непридатна, вважатимемо справедливою гіпотезу, якій відповідає густина ймовірності . Задача формулюється наступним чином: знаючи конкретне значення величини випадкової величини , визначити якій із гіпотез слід віддати перевагу. При вирішенні цієї задачі можна припустити помилку двох видів: :
Н0 відкидається, коли вона правильна - помилка 1-го роду.
Н0 приймається, коли правильна НІ - помилка ІІ- го роду.
Ймовірність з якою може бути відхилена нульова гіпотеза називається рівнем значущості. Рівень значущості задається заздалегідь. Ймовірність прийняття правильності рішення (гіпотеза Н0 є вірною) називається довірчою ймовірністю.
Для перевірки істинності Н0 гіпотези поступають наступним чином: нехай функція має вид, зображений на рис. 11. Якщо знаходиться в інтервалі , то гіпотеза Н0 із заданим рівнем значущості повинна бути визнана істинною. Якщо знаходится лівіше або правіше , де ймовірність попадання випадкової величини близька до нуля, то тут можливі два випадки: або гіпотеза Н0 невірна, або відбулася вельми неправдоподібна в даному випадку подія. На практиці в цій ситуації вважають правдоподібним першу умову, тобто визнається помилковість нульової гіпотези Н0 і вона відкидається. Для кількісної оцінки придатності гіпотези заштриховані області біля хвостів функції називають критичними областями даної функції розподілу і вважають, що попадання випадкової величини в критичну область свідчить про неприйнятність аналізованої гіпотези.
Залежно від закону розподілу критична область може містити тільки ліву, тільки праву або обидві заштриховані області біля хвостів функції розподілу. Ймовірність попадання випадкової величини в критичну область характеризується рівнем значущості , який можна знайти із співвідношень:
; .
Рис 11. Функція густини ймовірності випадкової величини . Кожна площа заштрихованої фігури чисельно рівна рівню значущості . |
В медицині вибір величини рівня значущості залежить від зіставлення втрат у разі помилкових висновків в ту або іншу сторону: чим вагоміші втрати від помилкового відхилення нульової гіпотези, тим меншою вибирається величина значення . Зазвичай, на практиці, значення приймається рівним 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Найчастіше використовується =0,05, яке означає, що при користуванні певним статистичним критерієм, в середньому в п'яти випадках із ста статистична гіпотеза, що перевіряється, буде відхилена помилково.