Показники варіації
Середні величини дають узагальнену характеристику варіюючої ознаки досліджуваної сукупності. Розрахувавши їх, необхідно усвідомити, наскільки вони типові, надійні та наскільки однорідна сукупність за досліджуваною ознакою.
Статистичні сукупності можуть мати однакові значення середньої, але значно відрізнятися коливаннями індивідуальних даних. За характером і ступенем відхилення (варіації) ознаки можна зробити висновок щодо якісної однорідності статистичної сукупності та надійності самої середньої.
Нариклад, в одному випадку навантаження 10 суддів міського суду, що спеціалізуються на розгляді цивільних справ, становило:
20, 40, 55, 70, 40, 20, 70, 40 справ, Х1 = 44 справи,
у іншому –
10, 20, 20, 10, 80, 55, 60, 100 справ, Х2 = 44 справи.
Таким чином, середні величини рівні, а ряди істотно різняться між собою: перший ряд однорідніший, а отже, i середня надійніша, ніж у другому ряду.
Вивчення варіації ознаки дає можливість визначити, які чинники і якою мірою впливають на розмір досліджуваних ознак.
Вивчення варіації ознаки необхідно для наукової організації вибіркового спостереження, дисперсійного і кореляційного аналізу.
Для вивчення варіації ознаки використовують такі показники:
• розмах варіації (R),
• середнє лінійне відхилення (d),
• дисперсія і середнє квадратичне відхилення (а2, о),
• коефіцієнт варіації (σ),
Розмах варіації – це різниця між найбільшим і найменшим значенням ознаки: R = Хтах -Хтіп. Для нашого прикладу:
R1 =70-20 = 50 справ,
R2 =100-10 =90 справ.
Розходження істотні: R2 >R1, в 1,8 рази.
Розмах варіації відображає відхилення тільки крайніх значень ознаки, які часто бувають нетиповими або мають випадковий характер. Тому цей показник використовують для попередньої оцінки варіації.
Набагато точнішою буде характеристика варіації, якщо показник враховуватиме відхилення кожної варіанти від середньої. Відхилень при цьому утвориться стільки, скільки самих варіант. Тому для узагальненої характеристики величини усіх відхилень необхідно обчислити їх середню величину. Розрахунок ускладнюється тим, що сума всіх відхилень варіант від середньої величини дорівнює нулю, тому середнє відхилення варіант від середньої величини не можна обчислити як середню арифметичну.
У зв’язку з цим знаходять середню з модулів або з квадратів відхилення, одержуючи при цьому відповідно середнє лінійне відхиленняабодисперсію.
Середнє лінійне відхилення являє собою середню арифметичну з абсолютних значень (модулів) відхилень окремих значень варіаційної ознаки від його середнього значення.
Середнє лінійне відхилення обчислюється за такими формулами:
для незгрупованих даних
для згрупованих даних, коли частоти різні,
Через ігнорування знака цей показник варіації менш популярний, ніж дисперсія і середнє квадратичне відхилення.
Дисперсія– це середня величина із квадратів відхилень варіант, від середньої величини (δ2), а корінь квадратний із дисперсії називається середнім квадратичним відхиленням(δ).
Дисперсія та середнє квадратичне відхилення обчислюється за формулами:
для незгрупованих даних: | |
для згрупованих даних, коли частоти різні: |
Дисперсія і середнє квадратичне відхилення є найпоширенішими й загальновідомими абсолютними показниками варіації досліджуваної ознаки.
Усі розглянуті показники варіації характеризують абсолютний розмір відхилення виражаються в тих самих одиницях виміру, в яких виражені варіанти і середня. Для порівняльної характеристики варіації рядів із різними рівнями застосовується відносний показник варіації – коефіцієнт варіації.
Коефіцієнт варіації – це відношення середнього квадратичного відхилення до середньої величини, виражений у відсотках:
Він більш наочно характеризує варіацію ознаки і є певною мірою критерієм надійності середньої. Якщо коефіцієнт варіації більший 40 % (а в деяких випадках 33 %), то це означає, що середня не дуже надійна для даної сукупності і сукупність за цією ознакою неоднорідна.