Асиметрія і ексцес

Моменти варіаційного ряду

 

Означення: Початковим моментом варіаційного ряду порядку називається середня арифметична -ї степені варіант, тобто

 

. (13.4)

 

При , одержимо початковий момент нульового порядку

 

 

При , одержимо початковий момент першого порядку, який є середнім арифметичним.

 

Означення: Центральним моментом статистичного ряду порядку називається середнє арифметичне -тих степеней відхилень варіант від їх середніх

. (13.5)

 

При , одержимо отримаємо центральний момент нульового порядку

 

 

При , одержимо центральний момент першого порядку

 

 

При , одержимо центральний момент другого порядку, який є дисперсією

 

 

Означення: Коефіцієнтом асиметрії А називається відношення центрального моменту третього порядку до куба середнього квадратичного відхилення

. (13.6)

 

Якщо у варіаційному ряді більше варіант таких, що , тоді коефіцієнт асиметрії додатній, та має місце правостороння асиметрія. Якщо ж , тоді має місце лівостороння асиметрія.

 

Означення: Ексцесом або коефіцієнтом крутості Е називається зменшене на три одиниці відношення центрального моменту четвертого порядку до четвертої степені середнього квадратичного відхилення

 

. (13.7)

 

Якщо , тоді криві менш круті і називаються плоско вершинними, якщо - більш круті, мають більш гостру вершину і називаються гостро вершинними.

 

Приклад:

Для попереднього прикладу про розподіл 49 промислових підприємств за швидкістю обігових коштів, знайти асиметрію і ексцес.

 

Рішення

 

Для знаходження асиметрії і ексцесу складемо розрахункову таблицю

 

№п/п -
20 – 30 2699,66 -49592,75 911018,82
30 – 40 770,63 -6450,17 53987,92
40 – 50 42,51 69,29 112,94
50 – 60 1217,31 14157,32 164649,63
60 - 70 2339,28 50598,63 1094448,37
  7069,39 8782,32 2224217,68

 

Обсяг генеральної сукупності , тоді за формулою (12.2) заняття 12 знайдемо середню арифметичну

 

 

Тоді за формулою (12.4) і (12.5) заняття 12 знайдемо дисперсію і середнє квадратичне відхилення

 

.

 

За формулою (13.6) знайдемо асиметрію

 

За формулою (13.7) знайдемо ексцес

 

Розділ 13.5. Завдання до заняття 13

Теоретичні питання до заняття 13

1. Дати означення коефіцієнта варіації.

2. Що характеризує коефіцієнт варіації?

3. Дати означення медіани варіаційного ряду.

4. Як обчислюється медіана при дискретному розподілі, якщо обсяг виборки є непарним?

5. Як обчислюється медіана при дискретному розподілі, якщо обсяг виборки є парним?

6. Як обчислюється медіана при неперервному розподілі? Записати формулу та пояснити її складові.

7. Дати означення моди варіаційного ряду?

8. Як обчислюється мода при дискретному розподілі?

9. Як обчислюється мода при неперервному розподілі? Записати формулу та пояснити її складові.

10. Дати означення початкового моменту варіаційного ряду. Записати формулу та пояснити її складові.

11. Дати означення центрального моменту варіаційного ряду. Записати формулу та пояснити її складові.

12. Дати означення асиметрії. Записати формулу та пояснити її складові.

13. Що характеризує асиметрія?

14. Дати означення ексцесу. Записати формулу та пояснити її складові.

15. Що характеризує ексцес?

 

Розділ 14.1. Метод добутків для обчислення вибіркової середньої і дисперсії

В занятті 13 було розглянуто обчислення середньої вибіркової за означенням і два способи обчислення дисперсії (за означенням і за розрахунковою теоремою). Наведені вище приклади є універсальними і не мають обмежень в застосуванні. Але існує більш спрощений спосіб обчислення середньої вибіркової і дисперсії, який зручний при неперервному розподілі, коли кожний інтервал має однакову довжину або при дискретному, коли відстань між варіантами (шаг) є однаковою. Цей метод має назву метода добутків.

Розглянемо алгоритм застосування метода добутків.

1. В перший стовпець таблиці записують вибіркові варіанти (середини інтервалів), розташовуючи їх у порядку зростання.

2. У другий стовпець записують відповідні частоти варіант.

3. В третій стовпець записують умовні варіанти , причому за хибний нуль беруть варіанту, яка розташована приблизно в середині варіаційного ряду.

4. В четвертий стовпець записують добуток умовних варіант і відповідних частот, обчислюють .

5. У п’ятий стовпець записують добуток квадратів умовних варіант і знаходять .

6. Обчислюють умовні моменти

 

(14.1)

 

7. Обчислюють вибіркову середню і дисперсію за формулами

 

(14.2)

 

(14.3)

Приклад:

Знайти методом добутків вибіркову середню і дисперсію статистичного розподілу.

 

 

Рішення

 

Обсяг вибірки За хибний нуль приймемо варіанту, яка припадає на середину варіаційного ряду 10, відстань між сусідніми варіантами . Складемо розрахункову таблицю.

 

№ п/п
-4 -20
-3 -6
-2 -6
-1 -4
 

 

Обчислимо умовні моменти за формулами (14.1)

 

 

Обчислимо вибіркову середню і дисперсію за формулами (14.2) і (14.3)

 

Розділ 14.2. Властивості статистичних оцінок параметрів розподілу.

Оцінка генеральної дисперсії по виправленій вибірковій

Означення: Статистичною оцінкою невідомого параметру теоретичного розподілу називається функція від величин, що спостерігаються.

Для того, щоб статистична оцінка давала гарне наближення параметрів, що оцінюються, вони повинні задовольняти певним вимогам, до яких відносяться: незміщеність, ефективність та спроможність.

Означення: Незміщеною називається статистична оцінка , математичне сподівання якої при довільному обсязі вибірки дорівнює параметру , що оцінюється, тобто . Зміщеною називається оцінка, математичне сподівання якої не дорівнює параметру, що оцінюється.

Означення: Ефективною називається статистична оцінка, яка при заданому обсязі вибірки має найменшу можливу дисперсію.

При розгляді вибірок великого обсягу до статистичних оцінок застосовують вимогу спроможності.

Означення: Спроможною називається статистична оцінка, яка при прямує за ймовірністю до параметру, що оцінюється.

Наприклад, якщо дисперсія незміщеної оцінки при прямує до нуля, то така оцінка є спроможною.

Можна довести, що вибіркова середня є незміщена оцінка генеральної середньої, тобто

. (14.4)

 

Якщо за оцінку генеральної дисперсії прийняти вибіркову дисперсію, то ця оцінка буде приводити до систематичних помилок, надаючи занижене значення генеральної дисперсії. Пояснюється це тим, що вибіркова дисперсія є зміщеною оцінкою генеральної дисперсії, іншими словами, математичне сподівання вибіркової дисперсії не дорівнює генеральній дисперсії, що оцінюється. Тому для оцінки генеральної дисперсії за вибірковою дисперсією застосовують поправку Бесселя

 

(14.5)

 

Легко виправити вибіркову дисперсію використовуючи поправку Бесселя, тоді виправлену дисперсію будемо позначати через

 

 

(14.6)

 

Як видно з формул виправленої і вибіркової дисперсій, вони відрізняються тільки знаменниками. Очевидно, що при досить великих обсягах вибірки вибіркова і виправлена дисперсії відрізняються мало. На практиці користуються виправленою дисперсією, якщо приблизно

Виправлене середнє квадратичне відхилення визначається за формулою

 

(14.7)

 

Приклад:

Знайти виправлену дисперсію та виправлене середнє квадратичне відхилення за даними вибірки.

 

хі -3
пі

 

Рішення

 

Знайдемо середню вибіркову, враховуючи, що вона є незміщеною оцінкою

 

Оскільки обсяг вибірки менше 30, то знайдемо виправлену дисперсію та виправлене середнє квадратичне відхилення

 

 

Бессель Фрідріх Вільгельм(22.07.1784 – 17.03.1846 рр.) – німецький астроном, член Берлінської академії наук. У 20 років обчислив орбіту комети Галлея. При обробці спостережень широко застосовував теорію ймовірностей і метод найменших квадратів. Його ім’ям названо клас трансцендентних функцій, а також одну з інтерполяційних формул, одне з лінійних диференціальних рівнянь другого порядку.

 

Розділ 14.3. Точність оцінки. Довірча ймовірність. Довірчий інтервал

Точковою називається оцінка, що визначається одним числом. Інтервальною називається оцінка, що визначається двома числами – кінцями інтервалу. Інтервальні оцінки дозволяють встановити точність і надійність оцінок.

Означення: Надійністю (довірчою ймовірністю) параметра за статистичною оцінкою називається ймовірність , з якою виконується нерівність , де - додатнє число, що характеризує точність оцінки

 

.

 

Звичайно надійність оцінки задається наперед числом, близьким до одиниці. Після елементарних перетворень одержуємо

 

.

 

Це співвідношення свідчить, що ймовірність того, що інтервал включає в себе (покриває) невідомий параметр , дорівнює . А сам інтервал називається довірчим.

 

Довірчий інтервал для оцінки математичного сподівання