Обчислення помилок вибірки

Всі види відбору (крім механічного) можуть бути повторними і безповторними. Механічний відбір завжди безповторний.

Методи відбору:

1. Безповторний- коли відібрана у вибірку одиниця сукупності не повертається у генеральну і більше у відборі не приймає участі. Тобто збільшується можливість інших одиниць попасти у вибірку.

2. Повторний - коли відібрана у вибірку одиниця сукупності реєструється, повертається у генеральну сукупність і знову може бути відібрана.

Безповторний відбір дає точніші результати порівняно з повторним, оскільки за однакового обсягу вибірки без повторні дослідження охоплюють більше одиниць сукупності, ніж повторні.

Повторний та безповторний методи відбору залежно від характеру відбору одиниць поділяються на три види:

індивідуальний – відбір окремих одиниць сукупності;

груповий (серійний) – відбір груп (серії)одиниць;

комбінований – комбінація індивідуального і групового.

Від основи вибірки залежить спосіб добору елементів сукуп­ності для обстеження.

Для узагальнюючої характеристики похибок вибірки розраховують середню похибку репрезентативності, яку називають стандартною. Стандартна похибка вибірки m є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності. Розмір похибки залежить від чисельності вибіркової сукупності – чим більше одиниць відібрано, тим менша похибка; від варіації ознаки у генеральній сукупності – чим більша варіація ознаки, тим більша у середньому і похибка вибірки.

Середня помилка власне випадкової та механічної вибірок обчислюється за формулами (таб.6.4.1):

Таблиця 6.4.1

Спосіб відбору Без повторний відбір Повторний відбір
Для середнього значення ознаки
Для частки

 

де N − обсяг сукупності; n − обсяг вибірки; σ2 – дисперсія генеральна.

Оскільки на практиці генеральна дисперсія нам не відома, то використовують формули для повторної вибірки , для безповторної вибірки відомі з теорії ймовірностей. Тоді або .

 

При практичному використанні наведених формул слід враховувати, що:

a) дисперсія частки , де p i q – частки вибірки, елементам яких відповідно властиве і невластиве дане значення ознаки;

b) у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому враховується лише у малочислених вибірках;

c) коригуючий множник для безповторної вибірки при малих величинах наближається до 1, а тому при 1-5%-ній вибірці розрахунок ведеться за формулою для повторної вибірки; при 10%-вій вибірці коригуючий множник становить 0, 949, при 20%-вій – 0,894.

Крім стандартної похибки вибірки обчислюють похибку граничну – максимально можливе відхилення вибіркової оцінки від значення параметра в генеральній сукупності для заданої ймовірності F(x).

Гранична похибка вибірки: . Довірче число tвказує, як співвідносяться гранична та стандартна похибки.

Формула граничної похибки випливає з основних положень теорії вибіркового методу.

Однією з головних теорем, покладених в основу теорії вибіркового методу, є теорема П. Л. Чебишева, за допомогою якої він довів, що з ймовірністю, скільки завгодно близькою до одиниці, можна стверджувати, що при достатньо великому числі незалежних спостережень вибіркова середня буде мало відрізнятися від генеральної середньої при проведенні повторної вибірки.

Академік А. А. Марков довів збереження цієї умови для незалежних спостережень. Академік А. М. Ляпунов дослідив, що ймовірність відхилень вибіркової середньої від генеральної середньої при достатньо великому обсязі вибірки та обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень при різних значеннях t визначається за формулою

.

Значення цього інтеграла при різних значеннях t табульовані і наводяться в спеціальних таблицях.

Для , ; для , ; для , .

Це означає, що наприклад, з ймовірністю 0,954 можна стверджувати, що похибка репрезентативності вибірки не перевищує ±2μ .

Зі збільшенням вибіркової сукупності підвищується точність вибіркових даних. Проте іноді доводиться обмежуватися малою кількістю спостережень. Вибіркову сукупність, яка складається з порівняно невеликої кількості одиниць (20 ... 30), називають малою вибіркою. Математичною статистикою доведено, що й при малих вибірках характеристики вибіркової сукупності можна поширити на генеральну. Проте обчислення середньої та граничної похибок мають свої особливості.

При малих вибірках дисперсію обчислюють з урахуванням кількості ступенів вільності варіації.

Ступенем вільності варіації називають кількість одиниць, здатних змінюватися після того, як для всіх одиниць вибірки було визначено їх загальну характеристику.

Англійський вчений Ст’юдент винайшов закон розподілу відхилень вибіркових середніх від генеральної для малих вибірок. За цим законом він побудував таблиці, в яких наводяться значення критерію tдля малих вибірок.

Згідно з розподілом Ст’юдента ймовірна оцінка того, що гранична похибка не перевищить t–кратну середню похибку в малих вибірках, залежить від значення t та кількості ступенів свободи .

У практиці вибіркових спостережень використовують два типи оцінок − точкові і інтервальні.

Точкова оцінка − це значення параметра за даними вибірки: вибіркова середня − та вибіркова частка .

Інтервальна оцінка − це інтервал значень параметра, розрахований за даними вибірки для певної імовірності.

Межі довірчого інтервалу визначають на основі точкової оцінки та граничної похибки вибірки:

для середньої ;

для частки .

У статистичному аналізі часто постає потреба порівняти похибки вибірки різних ознак або однієї і тієї ж самої в різних сукупностях.

Такі порівняння виконують за допомогою відносної похибки, яка показу, на скільки відсотків вибіркова оцінки може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої – це коефіцієнт варіації вибіркових середніх:

.

На практиці достатнім рівнем точності вважається . Іноді використовують граничну відносну похибку, яка враховує ймовірність статистичного висновку:

.