Контрольная работа: Прогнозування моделями простої лінійної регресії

НЕПАРАМЕТРИЧНІ МЕТОДИ ОЦІНКИ ТІСНОТИ ЗВ`ЯЗКУ


План

1. Критерії Спірмена та Кендала

2. Критерій Фехнера

3. Коефіцієнти асоціації і контингенції

4. Коефіцієнт взаємної спряженості Пірсона і Чупрова

Література


1. Критерії Спірмена та Кендала

Серед непараметричних (емпіричних) методів оцінки тісноти зв’язку найбільше значення мають розрахунки рангових коефіцієнтів Спірмена  і Кендала .

Ці коефіцієнти можуть бути використанні для визначення тісноти зв’язку як між кількісними, так і між якісними ознаками при умові, якщо значення цих показників можуть бути впорядковані або проранговані по спаданню або зростанню ознаки.

Для визначення рангового коефіцієнта кореляції рангують (тобто записують у зростаючому або спадаючому порядку) всі значення факторної ознаки  і разом з тим записують відповідні значення результативної ознаки . Другими словами, визначають ранг по обох ознаках, тобто номер кожної ознаки в рангових рядах.

Ступінь тісноти зв’язку між ознаками визначається ранговим коефіцієнтом кореляції Спірмена по формулі:

де  - квадрати різниць рангів зв’язаних величин  і ; п - число спостережень (число пар рангів).

У випадку відсутності зв’язку ; при прямому зв’язку коефіцієнт  додатній, а при оберненому зв’язку - від’ємний.

Приклад 1. Визначити, чи існує залежність між стажем роботи та виробітком робітника для слідуючих даних:


Таблиця 1

№ п/п

Стаж роботи робітників, х, роки

Виробіток на 1 робітника, у

1 2,5 222
2 2,5 223
3 1 200
4 1 202
5 1 205
6 5 244
7 5 250
8 3 234
9 4,5 241
10 4,4 244
11 2,7 230

 

Рішення.

Фактори  і  ранжуємо (впорядкуємо) в порядку зростання (спадання) їх значень і заповнюємо табл. 2.

Таблиця 2

Ранг ознаки х

Ранг ознаки у

Рангова різниця

1 200 4 3 1 1
1 202 4 4 0 0
1 205 4 5 -1 1
2,5 222 1,5 1 0,5 0,25
2,5 223 1,5 2 -0,5 0,25
2,7 230 11 11 0 0
3 234 8 8 0 0
4,4 241 10 9 1 1
4,5 244 9 8 1 1
5 244 6,5 8 -1,5 2,25
5 250 6,5 7 -0,5 0,25
Всього 3,5-3,5=0 7

Визначаємо ранги по обох ознаках, тобто номер кожної ознаки в рангованих рядах. Для рівних значень факторів х та у ранг знаходять шляхом ділення суми рангів, що приходяться на неї, на число рівних значень.

3. Знаходимо рангову різницю  та .

4. Розрахуємо коефіцієнт кореляції рангів Спірмена:

Розрахунок рангового коефіцієнта Кендала відбувається за формулою:

де п - число спостережень; S - сума додатних та від’ємних балів по одній із зв’язаних величин, ранги котрої розміщені у відповідності з впорядкованими рангами другої.

2. Критерій Фехнера

Одним із найпростіших показників кореляційної залежності, пов’язаний з іменем відомого німецького вченого психофізика Фехнера.

Коефіцієнт Фехнера базується на застосуванні перших ступенів відхилень всіх значень взаємозв’язаних ознак від середньої величини по кожній ознаці.

Коефіцієнт Фехнера вимірює тісноту зв’язку за наступною формулою:

де  - число збігів та незбігів знаків відхилень значень фактичної і результативної ознак від своїх середніх, тобто  При цьому фіксуються збіги та незбіги знаків в відхиленнях від середньої у різних пар значень ознак.

Коефіцієнт Фехнера К змінюється в межах від - 1 до +1. Якщо зв’язок між ознаками обернений, то К від’ємний; у випадку прямого зв’язку - додатній. Чим ближче К до , тим зв’язок більш тісний.

Приклад 2. Розрахувати коефіцієнт Фехнера для наступних даних:

Таблиця 3

Стаж роботи, х

Виробіток на 1 робітника, у

Збіг чи незбіг знаків
2,5 - 222 - С
2,5 - 223 - С
1 - 200 - С
1 - 202 - С
1 - 205 - С
5 + 244 + С
5 + 250 + С
3 + 234 + С
4,5 + 241 + С
4,5 + 244 + С
2,7 - 230 + Н

Коефіцієнт Фехнера

Величина К досить близька до величини коефіцієнта рангової кореляції Спірмена, що свідчить про тісний зв’язок між ознаками х і у.


3. Коефіцієнти асоціації і контингенції

Для визначення тісноти зв’язку двох якісних ознак, кожна із котрих складається тільки із двох груп, використовують коефіцієнти асоціації і контингенції. Для їх розрахунку будується чотирьохклітинна таблиця кореляції, котра виражає зв’язок між двома явищами, кожне із них в свою чергу повинно бути альтернативним, тобто складається із двох якісно відмінних друг від друга значень ознаки (наприклад, хороший, поганий).

Наприклад, при вивчені залежності врожайності від кількості внесених в ґрунт добрив виділимо по врожайності і по кількості внесених добрив лише по дві групи. При цій умові можна побудувати наступну чотирьохклітинну таблицю.

Таблиця 4

Удобрено

Урожайність

Добре Погано Всього
Висока

а

в

a+b

Низька

с

d

c+d

Всього

à+c

b+d

Числа, які стоять на перетині рядків і граф a, в, c, d показують, скільки дільниць зустрічаються з тою або другою кількістю добрив, що внесені в ґрунт, з тією або другою врожайністю.

Коефіцієнт асоціації Юла і коефіцієнт контингенції розраховується за наступними формулами:

асоціації Юла ;

контингенції .

де a, в, c, d - кількісні характеристики досліджувальних груп.

Коефіцієнт контингенції завжди менший коефіцієнта асоціації Юла. Зв’язок рахується підтвердженим, якщо:

 або .

 

Приклад 3. Дослідити зв’язок між виконанням норм виробітку молодими робітниками і закінченням ними середньої школи. Результати обстеження характеризуються даними (табл. 5).

Таблиця 5

Групи робітників Виконують норму Не виконують норму Всього
Закінчили середню школу 78 22 100
Не закінчили середню школу 32 68 100
Всього 110 90 200

 

Рішення. За даними таблиці

Між досліджувальними ознаками спостерігається чіткий зв’язок, що підтверджується досить високими значеннями коефіцієнтів асоціації і контингенції.

4. Коефіцієнт взаємної спряженості Пірсона і Чупрова

Якщо кожна із якісних ознак складається більше ніж із двох груп, то для визначення тісноти зв’язку можна використати коефіцієнт взаємної спряженості Пірсона. Цей коефіцієнт розраховується за наступною формулою:

де q2 - показник взаємної спряженості.

Коефіцієнт Чупрова:

,

де К1, К2 - число груп по кожній із ознак.

Розрахунок коефіцієнта взаємної спряженості проводиться за наступною схемою (табл. 6).

Таблиця 6

Групи ознаки А Групи ознак В Разом

В1

В2

В3

А1

f1

f2

f3

n1

A2

f4

f5

f6

n2

A3

f7

f8

f9

n3

Разом

т1

т2

т3

Розрахунок q2:

по першому рядку

по другому рядку

по третьому рядку

.

 

Приклад 4. В таблиці 2.7 приведені згруповані дані накладних видатків (х) та собівартості продукції (у). За допомогою коефіцієнта взаємної спряженості дослідити зв’язок між собівартістю продукції та накладними витратами на реалізацію.

Рішення.

Розрахуємо q2:

по першому рядку


Таблиця 2.7

Накладні Собівартість Разом
витрати нижня середня висока
Нижні 19 12 9 40
Середні 7 18 15 40
Високі 4 10 26 40
Разом 30 40 50

по другому рядку

по третьому рядку

.

.

Підставляємо  у відповідні формули і знаходимо:

коефіцієнт Пірсона: ,

коефіцієнт Чупрова: .

Досить високе значення с вказує на наявність зв’язку між собівартістю продукції та накладними витратами на реалізацію.

Непараметричні методи вимірювання зв’язку використовуються для перевірки умов використання метода найменших квадратів, незалежності розподілу ознак, однорідності вибірок, наявності тренда в рядах динаміки.


Література

1.   Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.М., ЮНИТИ. 1998 - 1022 с.

2.   Ликеш И., Ляга Й. Основные таблицы математической статистики. - М. "Финансы и статистика", 1985. - 356 с.

3.   Доугерти Кристофер. Введение в эконометрику. Пер. с англ. - М., ИНФРА-М. - XIV. 1997 - 402 c.

4.   Maddala G.L., Kim In-Moo Unit Roots, Cointegration, and Structural Change. Cambridge Univ. Press., 1999.

5.   Davidson R., MacKinnon J.G. Estimation and Inference in Econometrics. Oxford Univ. Press., 1993.

Аденилатциклазный сигнальный механизм
АДЕНИЛАТЦИКЛАЗНЫЙ СИГНАЛЬНЫЙ МЕХАНИЗМ ДЕЙСТВИЯ ПЕПТИДОВ ИНСУЛИНОВОГО СУПЕРСЕМЕЙСТВА У ПОЗВОНОЧНЫХ И БЕСПОЗВОНОЧНЫХ Автореферат диссертации на ...
... белки (G-белки) стимулирующего (Gs) или ингибирующего (Gi) типа, состоящие из трех субъединиц - ѭ, b, ѭ и обеспечивающие сопряжение между рецептором и третьим компонентом системы ...
Наиболее выраженный АЦ активирующий эффект инсулина (10-11М-10-6М обнаруживается у куриных эмбрионов (10, 13, 16 суток) и цыплят (3 суток) при концентрации гормона 10-9М, и ...
Раздел: Рефераты по медицине
Тип: реферат
КУРСОВА РОБОТА на тему "СТАТИСТИКА ВИВЧЕННЯ ПРОДУКТИВНОСТІ ВЕЛИКОЇ РОГАТОЇ ХУДОБИ" Вступ Термін "статистика" походить від латинського "status", що ...
Узагальнюючою мірою варіації є середнє відхилення індивідуальних значень ознаки від центру розподілу.
Для порівняння впливу різних факторів в формуванні результативної ознаки розраховують коефіцієнт еластичності (Е) та ѭ-коефіцієнти:
Раздел: Рефераты по экономике
Тип: курсовая работа
ЗМІСТ Вступ 1. Огляд літератури 2. Статистичний аналіз урожайності технічних культур 2.1 Аналіз рівня та факторів урожайності методоманалітичного ...
Ця форма зв"язку характеризується тим, що кожному значенню однієї ознаки відповідає одне або кілька значень іншої ознаки.
Отже початковий рівень урожайності зернових культур дорівнює 205 ц/га., а кожний наступний рівень зменшується на 1,5 ц/га..
Раздел: Рефераты по экономике
Тип: курсовая работа
Комплексний заклад ресторанного господарства
Вступ Перехід до ринкових відносин в Україні, розширення споживчих ринків, впровадження нових форм господарювання, відобразились в усіх сферах ...
Також слід зазначити що і у обідній час (з 13.00 до 15.00) спостерігається значне завантаження торгового залу.
СПР
Раздел: Рефераты по менеджменту
Тип: дипломная работа
Теоретичні основи теплотехніки
1. Характеристика курсу Дистанційний курс "Термодинаміка та теплотехніка " Загальна кількість кредитів: національних 2 ECTS 3,5 Лекційне навантаження ...
R - коеф іцієнт відбивання;
Хвиля зменшення тиску в усті сопла, яке виникає при Р2 < Ркр (ѭ < ѭ кр) не може поширюватись в соплі назустріч течії, так як а=w, як наслідок для всіх значень Р2 < Ркр (ѭ < ѭ кр) В ...
Раздел: Промышленность, производство
Тип: учебное пособие