ЛЕКЦІЯ 2 «Метод знаходження кривої підгонки».

Анотація

Основні види кривих підгонки. Коефіцієнт детермінації та інші способи оцінки моделей. EX POST як імітація процесу прогнозування.

 

2.1 Основні види кривих підгонки

Метод підгонки входить до числа найвідоміших методів прогнозування. Він полягає в тому, щоб знайти криву або групу кривих, які з достатньою точністю описували б початкову інформацію. Розрізняють наступні види кривих підгонки: лінійна, параболічна, поліноміальна 3 ступеню, логарифмічна, експоненційна, ступенева, гіперболічна, логістична, S-образна. Існують і інші види кривих, але перелічені криві є найбільш поширеними і вживаними.

Рівняння прямої підгонки називається лінійним рівнянням регресії У по X (у прогнозуванні оцінене значення змінної прийнято позначати з кришкою вгорі: ) (див. рис. 2.1).

 

Рисунок 2.1 – Лінія регресії

 

Рівняння параболи має наступний вигляд . На рис. 2.2 зображений графік параболи.

 

Рисунок 2.2 – Крива підгонки – парабола

 

Рівняння третього ступеня має вигляд (див. рис. 2.3):

 

Рисунок 2.3 – Крива підгонки – графік многочлена третього ступеня

 

Рівняння логарифмічної функції має вигляд: (див. рис. 2.4).

 

Рисунок 2.4 – Крива підгонки – графік логарифмічної функції

 

Рівняння експоненціальної кривої має вигляд: = b1 exp(b2t).

Ми нагадаємо, що exp(z)= ez, де е ≈ 2,718. Зважаючи на важливість цього виду рівнянь для прогнозування, ми зупинимося на ньому докладніше. Розглянемо темп зростання у момент t.

.

 

Ми бачимо, що темпи зростання для експоненціальної кривої на даному інтервалі постійні. Оскільки ez - 1 ≈ z при малих значеннях z, то b2 × 100% приблизно рівно темпам приросту (див. рис. 2.5).

 

Рисунок 2.5 – Крива підгонки – експоненціальна крива

Рівняння ступеневої функції виглядає таким чином: = b1 (tb2) (див. рис. 2.6).

 

Рисунок 2.6 – Крива підгонки – графік ступеневої функції

 

Рівняння гіперболи має вигляд: (див. рис. 2.7).

 

Рисунок 2.7 – Крива підгонки – гіпербола

 

Рівняння S-образної кривої має вигляд: . Як видно з цього рівняння, S-образна крива виходить шляхом послідовного застосування гіперболічної і експоненціальної функцій (див. рис. 2.8).

 

Рисунок 2.8 – Крива підгонки – S-образна крива

Рівняння логістичної кривої має вигляд (див. рис. 2.9).

 

Рисунок 2.9 – Крива підгонки – логістична крива

 

2.2 Коефіцієнт детермінації та інші способи оцінки моделей

Середньо квадратична помилка (mean squared error, MSE) розраховується за формулою:

,

де: n – кількість спостережень;

е – залишок, який визначається, як ;

Yi – фактичне значення показника;

– теоретичне значення показника.

Коефіцієнт детермінації характеризує ступінь близькості змодельованих значень в їх сукупності до початкових даних. Коефіцієнт детермінації визначається виразом і позначається як R2. Отже, коефіцієнт детермінації:

  (2.1)  

де: – середнє значення показника.

З визначення виходить, що R21. Рівність R2 = 1 можливо тоді і тільки тоді, коли всі залишки рівні нулю, тобто процес в точності описується моделлю; проте на практиці цього майже ніколи не трапляється. З (2.1) витікає, що для одного і того ж набору даних коефіцієнт детермінації R2 буде ближчим до одиниці у моделі з меншою середньоквадратичною помилкою. Таким чином, R2 дійсно характеризує ступінь близькості змодельованих даних в їх сукупності до початкових даних. З формули (2.1) також витікає, що значення коефіцієнта детермінації залежить від дисперсії початкових даних. Наприклад, моделі для двох різних рядів даних можуть мати одні і ті ж значення залишків е1, е2, ..., еn, але ряд даних з великим значенням дисперсії матиме і більше значення коефіцієнта детермінації.

Важливо пам'ятати, що R2 – це всього лише позначення і, взагалі кажучи, може бути негативним числом.

У разі лінійної регресії невід’ємне число називається коефіцієнтом множинної кореляції і використовується набагато рідше, ніж коефіцієнт детермінації.

R2 є часткою від ділення дисперсії змодельованих значень на дисперсію початкових. У ідеальному випадку, коли R2 = 1, Var( )= Var(Y). Всі крапки (Х1, Y1), (X2, Y2), ..., (Хn, Yn) лежать на одній і тій же прямій тоді і тільки тоді, коли |р(Х, У)| = 1. р може приймати негативні значення, а R, за визначенням, повинен бути завжди більше або рівний нулю.

Коефіцієнт детермінації, безумовно, є важливим критерієм при виборі моделі. Якщо модель погано описує початкові дані, від неї не можна чекати добрих результатів при прогнозуванні. На жаль, зворотне невірне.

При порівнянні різних моделей крім коефіцієнта детермінації R2 використовуються також дві інші характеристики – MAD і МАРЕ.

Вираз називається середнім абсолютним відхиленням (mean absolute deviation, MAD).

Вираз називається середньою абсолютною помилкою у відсотках (mean absolute percent error, МАРЕ).

На відміну від R2, і MAD, і МАРЕ мають простий наочний сенс, що важливе для їх практичного застосування.

MAD і МАРЕ виявляються корисними при порівнянні залишків окремих значень моделі.

 

2.3 Верифікація прогнозів. EX POST як імітація процесу прогнозування

Статистичні прогнози ґрунтуються на гіпотезах про стабільність значень величини, що прогнозується; закону її розподілу; взаємозв'язків з іншими величинами тощо. Основний інструмент прогнозування — екстраполяція.

Суть прогнозної екстраполяції полягає в поширенні закономірностей, зв'язків і відношень, виявлених в t-му періоді, за його межі.

Залежно від гіпотез щодо механізму формування і подальшого розвитку процесу використовуються різні методи прогнозної екстраполяції. Їх можна об'єднати в дві групи:

- екстраполяція закономірностей динаміки — тренду і коливань;

- екстраполяція причинно-наслідкового механізму формування процесу — факторне прогнозування.

Ці методи різняться не процедурою розрахунків прогнозу, а способом описування об'єкта моделювання. Екстраполяція закономірностей розвитку ґрунтується на вивченні його передісторії, виявленні загальних і усталених тенденцій, траєкторій зміни в часі. Абстрагуючись від причин формування процесу, закономірності його розвитку розглядають як функцію часу. Інформаційною базою прогнозування слугують одномірні динамічні ряди.

При багатофакторному прогнозуванні процес розглядається як функція певної множини факторів, вплив яких аналізується одночасно або з деяким запізненням. Інформаційною базою виступає система взаємозв'язаних динамічних рядів. Оскільки фактори включаються в модель у явному вигляді, то особливого значення набуває апріорний, теоретичний аналіз структури взаємозв'язків.

Важливим етапом статистичного прогнозування є верифікація прогнозів, тобто оцінювання їх точності та обґрунтованості. Ha етапі верифікації використовують сукупність критеріїв, способів і процедур, які дають можливість оцінити якість прогнозу.

Найбільш поширене ретроспективне оцінювання прогнозу, тобто оцінювання прогнозу для минулого часу (ex-post прогноз). Процедура перевірки така. Динамічний ряд поділяється на дві частини: перша — для t= 1,2,3, ...,p — називається ретроспекцією (передісторією), друга — для t=p + 1, p + 2, p + 3, ..., p +(n —р) — прогнозним періодом.

За даними ретроспекції моделюється закономірність динаміки і на основі моделі розраховується прогноз Yp+v, де v — період упередження. Ретроспекція послідовно змінюється, відповідно змінюється прогнозний період, що унаочнює рис. 2.10 (для v = 1).

 

 

Рис. 2.10 – Схема ретроспективної перевірки точності прогнозу для v = 1

 

Оскільки фактичні значення прогнозного періоду відомі, то можна визначити похибку прогнозу як різницю фактичного уt і прогнозного Yt рівнів: et = yt – Yt. Всього буде n —р похибок. Узагальнюючою оцінкою точності прогнозу слугує середня похибка:

абсолютна , квадратична .

 

Для порівняння точності прогнозів, визначених за різними моделями, використовують похибку апроксимації (%):

 

Якщо результат оцінювання точності прогнозу задовольняє визначені критерії точності, скажімо, 10%, то прогнозна модель вважається прийнятною і рекомендується для практичного використання. Очевидно, що похибка прогнозу залежить від довжини ретроспекції та горизонту прогнозування. Оптимальним співвідношенням між ними вважається 3 : 1.

При оцінюванні та порівнянні точності прогнозів використовують також коефіцієнт розбіжності Г. Тейла, який дорівнює нулю за відсутності похибок прогнозу і не має верхньої межі:

 

Існуючі методи верифікації прогнозів у більшості своїй ґрунтуються на статистичних процедурах, які зводяться до побудови довірчих меж прогнозу, себто до побудови інтервальних прогнозів.

Помилки ex post прогнозів можна оцінювати таким же чином, як ми оцінювали залишки моделі. Тобто ми можемо розглянути відповідні значення MSE, MAD і МАРE.

Для оцінки помилок ex post прогнозів використовується також число, яке називається коефіцієнтом нерівності Тейла (Theil's inequality coefficient):

 

де T – число ex post прогнозів.

Еx post – один з найнадійніших методів при виборі моделі прогнозування. При цьому особливу увагу слід звертати на останні значення моделі. Стабільність коефіцієнтів моделі, разом з іншими характеристиками, які вказують на достатньо високу точність (R2, MAD і МАРE), говорить на користь вибраної моделі.

Перш ніж приступити безпосередньо до прогнозування майбутніх значень, прогнозист повинен спочатку зрозуміти ті кількісні закономірності (або хоча б частина з них), які лежать в основі бізнес-процесу. Єдине, що він має в розпорядженні, це початкові дані. Звідси витікає, що на початку прогнозист повинен створити модель, яка достатньо добре описувала б саме початкові дані. Різниця між істинним і прогнозованим значеннями називається помилкою прогнозу.

Тут потрібно відзначити, що прогнозовані значення необов'язково повинні відноситися до майбутнього. Прогнозувати можна будь-які величини, що не входять в набір початкових даних. Подібні прогнозовані значення часто використовуються, коли необхідно відновити дані, відсутні через які-небудь причини.

Ідея ex post прогнозування. З цією метою початкові дані розбиваються на дві групи, так щоб в другій групі знаходилися пізніші дані, що становлять звично приблизно 15% всієї інформації. Ці дані будуть потім використовуватися для тестування. При невеликому об'ємі початкових даних в другій групі можна розглядати до 30% початкової інформації.

Але спочатку ми повинні задати горизонт прогнозування. При цьому кожного разу ми порівнюватимемо набуті значення з наявною інформацією. У цьому якраз і полягає головна перевага ex post прогнозування. При звичному прогнозуванні у нас такої можливості немає. Припустимо, що нас цікавить прогноз на один квартал вперед і ми хочемо протестувати лінійну модель. Нижче ми приводимо докладний алгоритм ex post прогнозування.

Алгоритм ex post прогнозування:

1. Знаходимо лінію регресії L для перших 13 значень.

2. З рівняння L визначаємо прогноз на 14-й квартал.

3. Порівнюємо одержаний прогноз з наявною інформацією за 14-й квартал. Знаходимо помилку.

4. Повторюємо пункти 1-3 послідовно для перших 14, 15 і 16 значень.

В результаті ми одержуємо таблицю, що містить ex post прогнози і відповідні помилки для останніх чотирьох кварталів.

В процесі ex post прогнозування, додаючи нові дані, ми кожного разу одержували інше рівняння. Це приклад рекурсивного ex post прогнозування, на відміну від нерекурсивного, при якому рівняння, одержане за даними першої групи, залишається незмінним.

 


ЛЕКЦІЯ 3 «Метод екстраполяції тенденції по одному часовому ряду»

Анотація

Поняття тенденції, способи встановлення наявності тенденції. Прості методи екстраполяції тенденції: екстраполяція на основі аналітичних показників рядів динаміки, на основі плинної середньої та екстраполяція на основі індексу сезонності.

3.1 Поняття тенденції, способи встановлення наявності тенденції

Під тенденцією розуміють деякі загальні напрямки розвитку процесу (явища), довгострокову закономірність.

При прогнозуванні методами екстраполяції виходять з інерційності явищ (процесів), що досліджуються і прогнозуються.

Ступінь інерційності залежить від розміру і масштабу процесу, що вивчається. На мікрорівні вплив окремого фактора може миттєво змінити ситуацію, в той час, коли на макрорівні, через дії багатьох факторів, які здійснюють часом протилежний один одно­му вплив, інерційність зберігається у більшій мірі.

При значній інерційності економічних процесів (явищ), що досліджуються, можна з достатнім ступенем імовірності сподіватися, що закономірності, які виникли в «передісторії», будуть з незначними змінами діяти і в прогнозованому періоді.

Основу екстраполяційних методів прогнозування складають динамічні ряди. Є ряд способів перевірки гіпотези про існування тенденції у динамічному ряду.

Один з найпростіших методів базується на порівнянні середніх рівнів ряду. Для цього динамічний ряд розбивається на дві, приблизно рівні частини за кількістю елементів. Кожна частина розглядається умовно як самостійна сукупність. Якщо динамічний ряд має певну тенденцію, то середні, які обчислені для кожної сукупності, повинні суттєво розрізнятися між собою. Якщо ж розходження будуть незначними, тобто випадковими, то динамічний ряд тенденції не має.

Для оцінки істотності відмінності між середніми значеннями двох динамічних рядів використовується t-критерій Стьюдента.

Розходження буде істотним, якщо розрахункове значення t-критеріяСтьюдента(tp) буде не менше його табличного значення (tT).

Розрахункове значення t-критерія обчислюється таким чином:

 

(3.1)

 

де середнє значення рівня відповідно до першої і другої частин ряду, розрахованих для інтервальних динамічних рядів як середнє арифметичне:

 

(3.2)

 

де n1,n2 - кількість елементів відповідно першої і другої частин ряду.

- стандартне відхилення.

- дисперсія відповідно першій і другій частин ряду.

 

(3.3)

 

3.2 Прості методи екстраполяції тенденції

Прості методи прогнозування на основі екстраполяції тенденції використовуються в управлінні виробництвом, оскільки мають ряд переваг.

До переваг простих методів слід віднести:

- достатньо простий апарат дослідження, що привертає до нього широке коло спеціалістів;

- можливість використання для виконання розрахунків портативних і нескладних обчислювальних засобів;

- швидкість виконання розрахунків в оперативному режимі;

- наявність відносно невеликого масиву інформації.

Нижче наведені прості методи екстраполяції тенденції на основі застосування аналітичних показників динамічних рядів, плинної середньої та індексу сезонності.

3.2.1. Екстраполяція на основі аналітичних показників рядів динаміки

Динамічним рядом (рядом динаміки) називається послідовність показників, які характеризують зміну явища (процесу, об'єкта) у часі. Окремі спостереження динамічного ряду називаються рівня­ми.

За часом, відображеним у динамічних рядах, вони поділяються на моментні й інтервальні.

В моментних рядах динаміки рівні виражають величину явища на відповідну дату, наприклад, залишки готової продукції на пер­ше число кожного місяця, вартість основних фондів на початок, чи кінець року та ін.

В інтервальних рядах рівні виражають розміри явищ за про­міжок часу, наприклад, випуск продукції за місяць, квартал, рік.

При побудові динамічних рядів слід в першу чергу приділити увагу на порівнянність рівнів ряду. Це значить, що усі рівні повинні виражатися в однакових одиницях виміру, розраховуватися по єдиній методології, включати єдине коло об'єктів.

Позначимо:

уlпочаткове значення рівня динамічного ряду;

упкінцеве значення рівня динамічного ряду;

уiумовно прийнятий (i-й) рівень динамічного ряду;

п — кількість елементів динамічного ряду.

Наведемо основні аналітичні показники динамічного ряду, які використовуються у прогнозуванні:

а) абсолютний приріст:

1) ланцюговий

(3.4)

2) базисний

(3.5)

б) середній абсолютний приріст

(3.6)

в) коефіцієнт росту:

1) ланцюговий

(3.7)

2) базисний

(3.8)

3) за весь період

(3.9)

г) коефіцієнт приросту

Knp= kp- 1; (3.10)

д) середній коефіцієнт росту

(3.11)

е) середній коефіцієнт приросту

(3.12)

ж) абсолютний розмір 1% приросту:

1) ланцюговий

(3.13)

2) за весь період

(3.14)

з) коефіцієнт випередження (відставання)

(3.15)

Добуток ланцюгових коефіцієнтів росту дорівнює базисному коефіцієнту росту за весь період, тобто

(3.16)

що може бути доведено таким чином.

Нехай маємо динамічний ряд за 5 років та рівень показника за базисний рік, що передує рокам п'ятирічки (у0). Добуток ланцюго­вих коефіцієнтів росту складе

 

тобто підтверджується залежність (3.16)

На основі наведених аналітичних показників, які широко застосовуються для оцінки динамічних рядів, можна вивести залежності, що можуть бути використані для побудови прогнозів:

(3.17)

(3.18)

(3.19)

(3.20)

де — тут і далі таким чином позначаються прогнозні значення показника.

Т — величина горизонту прогнозу (Т = 1; 2; 3 ...)

Практичне застосування зазначених залежностей покажемо на прикладах.

Приклад 1.

В таблиці 3.1 наведені дані про середнє споживання кондитерських виробів на одну людину по області за рік. Використовуючи рівняння (3.18; 3.20), побудуємо прогноз споживання кондитерських виробів на наступну п'ятирічку.

 

Таблиця 3.1 – Середньорічне споживання кондитерських виробів по області

Номер року, t Споживання кондитерських виробів на одну людину в рік, кг. Номер року, t. Споживання кондитерських виробів на одну людину в рік, кг.
1 2 3 4
10,7 15,9
11,5 17,2
12,2 18,1
13,4 19,8
15,0 21,2
15,0    

 

У табл. 3.1 наведені дані по двох п'ятирічках та базисному року.

Остаточно про якість прогнозу можна судити лише після того, як подія відбулася. Щоб оцінити надійність застосованого методу, використовуються так званий метод «прогноз екс-пост». Такий підхід застосовується і для інших кількісних методів прогнозування.

Використовуючи дані перших шести років — базисний рік та роки першої п'ятирічки, розрахуємо відповідно:

Середній абсолютний приріст

 

Середньорічний коефіцієнт росту

 

На основі залежності (3.18) складемо прогноз споживання кон­дитерських виробів на період .

 

 

 

Результати розрахунків зведені в таблицю та порівняні з фактичними даними.

Складемо прогноз споживання кондитерських виробів на основі формули (3.20)

 

 

 

Результати прогнозу порівняні із фактичними даними та оцінена якість прогнозу (таблиця 3.3)

Таблиця 3.2 – Оцінка якості прогнозу, складеного на основі середнього абсолютного приросту

Фактичне значення, кг Прогнозоване значення, кг Відхилення
Абсолютне (гр2-гр3), кг Відносне (гр4:гр2)100%
1 2 3 4 5
15,9 15,9
17,2 16,8 0,4 2,3
18,1 17,7 0,4 2,2
19,8 18,6 1,2 6,1
21,2 19,5 1,7
  Середнє значення 0,7 3,7

 

Таблиця 3.3 – Оцінка якості прогнозу, складеного на основі середньорічного коефіцієнта росту

Фактичне значення, кг Прогнозоване значення, кг Відхилення
Абсолютне (гр2-гр3), кг Відносне (гр4:гр2)100%
1 2 3 4 5
15,9 -0,1 -0,6
17,2 17,2
18,2 18,4 -0,3 -1,7
19,8 19,7 0,1 0,5
21,2 0,2 0,9
    Середнє значення 0,1 0,7

 

Порівнюючи результати прогнозів, поданих в таблиці 3.2 та таблиці 3.3, можна зробити висновок про те, що використання середньорічного коефіцієнта росту забезпечує більш високу точність прогнозу, про що свідчать відхилення за всі роки і в цілому за п'ятиріччя.

Для складання прогнозу за межі наявних даних, тобто на пер­спективу, розрахуємо середньорічний коефіцієнт росту на основі другої п'ятирічки з використанням базисного періоду

 

Прогноз споживання кондитерських виробів на наступне п'ятиріччя складе:

 

 

 

Прогноз споживання кондитерських виробів складено з урахуванням зберігання тенденцій, які склалися в «передісторії».

Суттєвим недоліком показників середнього абсолютного приросту та середнього коефіцієнта росту є те, що значення їх цілком залежить тільки від крайніх рівнів динамічного ряду. Проміжні значення, які багато в чому, а іноді і в вирішальній мірі визначають тенденцію змін показників, по суті в розрахунках не беруть участі. Зазначений недолік багато в чому усувається шляхом аналітичного вирівнювання рядів динаміки, що буде розглянуто у наступному параграфі.

Приклад 2.

В управлінні бурякоцукровим виробництвом дуже важлива об'єктивна оцінка очікуваних урожайності та цукристості буряка, на основі яких визначається валовий збір буряка та обсяг виготовленого цукру. Першочергове значення мають короткострокові прогнози показників, що орієнтовані на поточний виробничий рік, який охоплює приблизно період вересень-січень.

В основу розрахунків середньої урожайності буряка та середньої цукристості заготовленого буряка покладені значення вказа­них показників за станом на перше жовтня.

Для одержання названих показників у агропромисловому ком­плексі щодекадно робляться оцінки маси кореня (з 1 липня по 1 жовтня) та цукристості буряка (з 20 липня по 1 жовтня). Задача полягає у тому, щоб на основі одержаних даних, оцінити значення Цих показників за станом на 1 жовтня.

З множини методів, які рекомендовані для оцінки значення вка­заних показників на 1 жовтня, найбільш простий та доступний — це використання значень приросту буряка за декади. Для розрахунку приросту використовуються середні значення маси кореня на кожну декаду, яка визначається за формулою:

(3.21)

де — середнє значення маси кореня на і-у декаду;

Pij— маса кореня в i-у декаду j-го року;

sjплоща посіву j-го року;

mj— густота насадження коренеплодів по стану на 20 серпня j-го року.

Прирости розраховуються за формулою (3.4), тобто:

 

В таблиці 3.4 наведені дані про абсолютні прирости маси кореня, які розраховані на основі середніх значень маси кореня за 10 років.

 

Таблиця 3.4 – Абсолютні прирости маси кореня (г) по Волинському облбурякоцукропромі

     
     
     

 

Отримавши дані про масу кореня станом на 1.07, можна, використовуючи показники таблиці 3.4, визначити очікуване значення названого показника станом на 1.10

(3.22)

Якщо поступає інформація за наступні декади, то розрахунки виконуються таким чином:

 

 

і т.д.

Припустимо, за станом на 1.07 поточного року маса кореня ста­новила 25г. Тоді очікувана маса кореня за станом на 1.10 становить

 

В таблиці 3.5 наведені результати послідовних прогнозів на ос­нові застосування абсолютних приростів.

 

Таблиця 3.5 – Результати прогнозу маси кореня по Волинському облбурякоцукропромі

За станом на : Маса кореня, г.
1.07 10.07 20.07 1.08 10.08 20.08 1.09 10.09 20.09 1. 10
1.07 64
10.07 110
20.07 165
1.08 216
10.08 262
20.08 300
1.09 330
10.09 360
20.09 376
1.10

Примітка:Над рискою таблиці 3.5 подані прогнозовані значення, під рискою — фактичні.

Результати прогнозу достатньо точні. Враховуючи, що фактичне значення маси кореня за станом на 1.10 дорівнює 376 г, то розходження по той, чи інший бік становило від 376 - 382 = -6 г, або 1,6%, до 376 - 367 = 9 г, або 2,4%.

За таким ж самим методом прогнозується цукристість буряка.

Слід відмітити, що прогнозування найважливіших показників буряко-цукрового виробництва було реалізовано на ЕОМ і функціонувало у реальному режимі часу для Волинського облбурякоцукропрому і Укрбурякоцукропрому протягом тривалого часу.

3.2.2. Екстраполяція на основі плинної середньої

Метод плинної середньої базується на використанні залежності:

(3.23)

де п — кількість років «передісторії».

Коефіцієнт li розраховується за формулою:

(3.24)

де і — число, яке означає послідовний натуральний ряд «передісторії», починаючи з останнього;

b — визначається за таблицею, поданій нижче:

 

N
b 0,500 0,400 0,333 0,286 0,250 0,222

 

Визначимо значення l для п'ятирічки.

Згідно з даними наведеної вище таблиці при п=5, b=0,333.

Звідси:

 

 

 

Якщо підставити розраховані значення l у формулу (3.23), отримаємо:

 

Особливістю методу плинної середньої є те, що рівень показників, який знаходиться ближче до прогнозованого періоду, чинить більший вплив на значення прогнозованих показників, порівняно з віддаленими періодами. Досягається це завдяки коефіцієнтуl.

Прогнозні значення показників розраховуються наступним чином:

 

 

 

 

 

 

На основі даних другої п'ятирічки, включаючи також базисний період (таблиця 3.1) складемо прогноз споживання кондитерських виробів на основі методу плинної середньої. Розрахуємо абсолютні прирости:

 

 

 

Виходячи з наведених вище залежностей

 

 

 

 

 

 

Порівняємо розрахунки прогнозу споживання кондитерських виробів на одну людину по області, що розраховані на основі середньорічного коефіцієнту росту і плинної середньої (таблиця 3.6).

Таблиця 3.6 — Прогноз споживання кондитерських виробів на наступну п'ятирічку, розрахований двома методами, кг.

Роки   Результати прогнозу, що розраховані на основі:
середнього коефіцієнту росту, кг плинної середньої, кг
22,7 22,5
24,3 23,8
26,0 24,9
28,0 25,8
29,9 26,3

 

Дані таблиці 3.6 свідчать про те, що прогноз, складений на основі середньорічних коефіцієнтів росту, за результатами дещо випереджає прогноз, складений за методом плинної середньої.

Який прогноз виявиться точнішим, зробити висновки заздалегідь важко.

Разом з тим перевага методу плинної середньої в тому, що на значення прогнозованих показників впливають в тій чи іншій мірі усі дані «передісторії», в той час, коли значення середньорічного коефіцієнта росту визначається тільки крайніми величинами динамічного ряду.

Наявність альтернативних варіантів прогнозу дозволяє спеціалістам на основі досвіду, знання, інтуїції відібрати найбільш прийнятний.

3.2.3. Екстраполяція на основі індексу сезонності

В процесі господарської діяльності окремі галузі промисловості, торгівля, побут стикаються з циклічними коливаннями, які викликані сезонним характером виробництва та споживання товарів і послуг.

Сезонні коливання — це більш чи менш сталі внутрішньорічні коливання в ряді динаміки, що обумовлені специфічними умовами виробництва і споживання даного товару чи послуг. Для організації виробництва і реалізації продукції сезонних виробництв надзвичайно важливо вивчити тенденцію сезонних коливань, що склалися, і розробити прогноз на найближчу перспективу, головним чином, на наступний рік.

Для вивчення сезонних коливань використовуються спеціальні показники, які називаються індексами сезонності, а сукупність їх утворює сезонну хвилю.

За даними, які характеризують обсяг реалізації продукції хлібозаводами об'єднання (таблиця 3.7), розрахуємо індекси сезонності, побудуємо сезонну хвилю і прогноз обсягу реалізації продукції на окремі місяці наступного року.

Індекс сезонності визначається за формулою:

(3.25)

 

Таблиця 3.7 – Обсяг реалізації хлібобулочних виробів (тис.т)

Рік місяць 1-й рік 2-й рік 3-й рік 4-й рік Разом за 4 роки (2+3 + 4+5) В середньому за 4 роки гр6/4, Індекс сезон­ності   Прогноз обсягу реалізації продукції на наступний рік
1 2 3 4 5 6 7 8 9
5,3 5,4 5,5 6,4 22,6 5,65 74,6 6,1
5,4 5,6 5,7 6,7 23,4 5,85 77,2 6,3
6,2 5,9 6,9 25,0 6,25 82,5 6,7
6,4 6,6 6,7 7,3 27,0 6,75 89,1 7,3
7,0 7,2 7,5 7,7 29,4 7,35 97,0 7,9
7,5 7,7 8,0 8,2 31,4 7,85 103,6 8,5
8,0 8,1 8,5 8,7 33,3 8,33 110,0 9,0
8,5 8,6 8,8 9,1 35,0 8,75 115,5 9,4
8,9 9,0 9,2 9,5 36,6 9,15 180,8 9,9
8,3 8,5 9,0 9,1 34,9 8,72 115,1 9,4
8,0 8,3 8,6 8,4 33,3 8,33 110,0 9,0
7,5 7,9 8,3 31,7 7,93 104,7 8,5
Разом 87,0 88,9 91,7 96,0 363,6 - 1200,0 98,0
В серед­ньому           7,575 100,0  

 

де —середнє значення показника за прийнятий проміжок часу (у нашому прикладі середня величина за кожний місяць, гр.7);

—середнє значення показника за весь період;

к —кількість років (к = 1, 2, 3, 4);

n — кількість місяців (п = 1, 2, 3, ..., 12)

Розраховані для даних таблиці 3.7 індекси сезонності подані у графі 8, а їх ряд створює сезонну хвилю.

Індекс сезонності для складання прогнозу використовується таким чином.

Припустимо, що на наступний рік об'єднання передбачає ре­алізувати 98 тис. т. хлібобулочних виробів. Для того, щоб сформувати помісячний план реалізації продукції можна використати наступну залежність:

(3.26)

де — очікуваний місячний об'єм реалізації продукції (i = 1, 2, 12);

— очікуваний річний обсяг реалізації продукції;

іс— індекс сезонності;

п — кількість періодів (п = 12).

Результати розрахунків наведені в графі 9 таблиці 3.7. Застосування індексу не обмежується тільки дослідженням сезонного характеру виробництва і споживання продукції. В декількох галузях промисловості коливання виробництва продукції пов'язані з особливостями технології, характером сировини та іншими факторами. Так, у цукровій промисловості встановлена добова норма переробки цукрового буряка на початку виробничого сезону і в кінці його, як правило, не виконується, а в середині вироб­ництва є умови для перевиконання. Це пов'язано, головним чином, з технологічними властивостями сировини — цукрового буряка.

Звідси важлива задача визначення таких добових норм переробки цукрового буряка по декадах на наступний сезон, щоб в середньому була забезпечена норма переробки не менше 100%. Норма переробки в цілому на сезон визначається як добуток добової потужності на встановлений коефіцієнт використання потужності. В таблиці 3.8 наведені дані про процент виконання добової норми переробки буряка (відношення фактичної добової переробки буряка до встановленої норми на сезон) і порядок розрахунку прогнозованого (планового) завантаження цукрового заводу.

Позначимо:

N — добова потужність заводу;

Ртдобова продуктивність заводу, яка встановлена на друге півріччя.

— розрахункове значення виконання плану добової переробки буряка в середньому за друге півріччя, яке визначається за формулою:

(3.26)

де — обсяг переробленого буряка в i-ї декаді j-го року.

 

Таблиця 3.8 – Прогноз добової переробки цукрового буряка по декадах на наступний сезон

Декади Виконання плану добової переробки цукрового буряка, % Добова продуктивність, т
Фактично в середньому за п’ятиріччя, Вирівняне по рівнянню тренда*, Індекс сезонності   При нормі переробки буряка, що склалася   При прогнозованому завантаженні (гр4-p0):100
1 2 3 4 5 6
10,09 76,02 79,76 87,5 836,3 962,5
20,09 96,2 91,95 100,88 1058,2 1109,7
01,1 99,34 96,8 106,2 1092,2 1168,2
10,1 102,96 98,17 107,7 1132,6 1184,8
20,1 96,61 97,55 107,24 1062,7 1177,8
01,11 99,46 95,69 106,8 1094,0 1154,8
10,11 90,33 93,03 102,06 993,0 1122,6
20,11 82,67 89,85 98,57 909,3 1084,3
01,12 89,83 86,35 94,73 988,2 1042,1
10,12 78,38 82,66 90,69 862,2 997,5
20,12 64,42 78,88 85,54 686,6 951,9
01,01 97,43 75,07 82,36 1071,7 905,9
2-півріччя 91,63 91,15 100,0 1007,9 1100,0

 

В таблиці 3.8 подана в підсумковому рядку графи 3. Початкові дані для розрахунку граф 5 і 6 є: добова потужність — N = 1220т.;

Установлений коефіцієнт використання потужності на друге півріччя — К = 0,92.

Отже, планова добова продуктивність на друге півріччя складає Р0= KN = 0,92 - 1220 = 1100 т.

Дані таблиці 3.8 свідчать про те, що норма переробки буряка заводом не виконувалась. В графі 6 наведені розрахункові, з використанням індексу сезонності, значення добової переробки цукрового буряка по декадах, які дозволяють забезпечити ритмічну роботу заводу і виконання норми загрузки заводу в цілому на друге півріччя.


ЛЕКЦІЯ 4 «Метод згладжування і сезонне прогнозування»

Анотація

Наївна модель. Способи усунення тренда. Моделі згладжування для часових рядів, що не мають тренда: модель ковзного середнього, модель експоненційно зваженого ковзного середнього, комбінована модель. Визначення початкових значень моделі. Моделі згладжування з трендом: модель Холта, модель Брауна. Сезонні моделі.

4.1 Наївна модель

Зараз ми розглянемо найпростішу модель, яка коли-небудь використовувалася при прогнозуванні, – так звану «наївну модель». Значення моделі задаються наступною формулою:

(4.1)

Ідея наївної моделі (4.1) полягає в припущенні, що дане значення у момент часу t приблизно рівне попередньому значенню.

Стовпець значень Yt виходить з початкових даних просто зрушенням на один рядок вниз. На рис. 4.1 представлений графік цієї наївної моделі, який виходить відповідно з початкового графіка шляхом зрушення на одиницю управо. Прогноз для всіх кварталів, починаючи з 18-го, один і той же і рівний останньому значенню ряду даних: 248.

 

 

Рисунок 4.1 – Графік наївної моделі

 

Наївна модель застосовується в тих випадках, коли потрібно зробити короткостроковий прогноз, за умови, що не очікується великих змін в характері процесу. Важливість цієї моделі для прогнозування в першу чергу полягає у тому, що разом з лінійною моделлю і моделлю постійного зростання наївна модель служить мірилом для визначення ефективності будь-якої іншої моделі. На практиці це означає, що, перш ніж придбати яку-небудь нову модель, треба порівняти її характеристики з їх аналогами.

 

4.2 Способи усунення тренда

Якщо уважно подивитися на графік наївної моделі (рис. 4.1), то помітите, що крім зрушення на одиницю управо він в більшій своїй частині (у 5 випадках з 16) розташований нижче за початкову криву. Це пов'язано з тим, що наївна модель (див. формулу 4.1) не припускає існування у процесу лінійного тренда. Тобто наївна модель виявиться неефективною, якщо значення коефіцієнта b2 в лінійному рівнянні регресії значно відрізнятиметься від нуля. Існує досить багато інших моделей, набагато складніших, ніж наївна, які також припускають, що процес не має тренда. Як показник відсутності тренда у ряду Yiіноді береться коефіцієнт k:

(4.2)

Залишки лінійного рівняння регресії звичайно служать прикладом процесу, що не має лінійного тренда. Як правило, в бізнесі ми маємо справу з процесами, що мають тренд. Для того, щоб в цьому випадку можна було застосувати модель, призначену для процесів, що не мають тренда, можна поступити одним з наступних двох способів.

Спосіб 1. Розглянемо різниці або частки початкових даних. Таким чином, якщо є ряд даних Y1, Y2, ..., Yn, то розглядається ряд: Δ2, ...,Δn, де Δt = Yt – Yt-1, або ряд р2, ..., рn,де

(4.3)

Насправді прогнозисти звичайно поступають трохи інакше. До результатного ряду даних застосовується оператор ln. Toбто розглядається ряд: lnY1, …, lnYn, після чого до нього застосовується оператор приросту Δ. При значеннях рi, близьких до одиниці, можна нехтувати другим членом в розкладанні Тейлора і вважати, що ln(pt) ≈ pt - 1.

Так як ln(pt) = ln(1) + (ln(pt))¢(pt-1) + (ln(pt))¢¢/2!*(pt-1)2≈ 0 + 1/pt*(pt-1) = 0 + 1*(pt-1) =pt -1

Оператори Δi і рi називають операторами початкового ряду. При цьому абсолютно не гарантовано, що ряди даних, одержані шляхом застосування операторів Δi або рi, не матимуть тренда (У такому разі іноді застосовують повторно оператор Δ).

На рис. 4.2 представлене графічне зображення ряду р2,..., рn.

 

 

Рисунок 4.2 – Темпи зростання об'єму продажів

 

Якщо менеджер вважає, що можна нехтувати зміною в змодельованих квартальних темпах зростання, то він може розглядати р2, ..., рn як ряд, що не має тренда, і застосувати до нього наївну або будь-яку іншу модель, призначену для рядів, що не мають тренда.

Спосіб 2 полягає в розгляді залишків лінійної регресії і є одним з найчастіше використовуваних методів усунення тренда. Його називають методом детрендалізації.

Якщо коефіцієнт b2 лінійного рівняння регресії для ряду еiмає нулі в перших чотирьох десяткових розрядах, то він може вважатися рівним нулю. Тепер можна побудувати модель для ряду без тренда для залишків еі, потім знайти відповідне змодельоване значення ek при k > 17, і додати його до відповідного значення тренда. Оскільки наївна модель припускає, що et-1 ≈ et, то її слід застосовувати у тому випадку, коли коефіцієнт кореляції r(et-1, et ) при t = 2, ..., n, позитивний і значно відрізняється від нуля. У такому разі говорять, що в моделі лінійної регресії є позитивна автокореляція першого порядку. Існує спеціальний тест (тестДарбіна-Уотсона) на наявність автокореляції першого порядку.

Прогноз визначається шляхом додавання змодельованої помилки е19 до відповідного значення тренда.

 

4.3 Моделі згладжування для часових рядів, що не мають тренда:модель ковзного середнього, модель експоненційно зваженого ковзного середнього, комбінована модель

Основна задача прогнозиста – знайти модель або групу моделей, які адекватно описували б процес. Прогнози, у свою чергу, будуються вже виходячи з цих моделей. Моделі згладжування застосовуються, коли потрібно визначити загальний хід процесу, проігнорувавши при цьому зміни, викликані випадковими чинниками. У цьому вони схожі з моделями підгонки, з тією лише різницею, що у них більше значення надається останнім даним. Ця властивість моделі називається адаптивною. Інша важлива відмінність моделей згладжування від кривих підгонки полягає у тому, що вони задаються алгоритмами, а не аналітично, тобто функцією від часу. З рекурсивності моделей згладжування виходить одна їх дуже важлива властивість: значення моделі співпадають з відповідними expost прогнозами. Для цього достатньо пригадати, що expost прогнози також визначаються виключно виходячи з попередніх даних.

Значення моделі ковзного середнього (movingaveragemodel) визначаються наступною формулою:

(4.4)

Іншими словами, Yt дорівнює середньому k попередніх значень. Число k називається порядком ковзного середнього. Середнє значення завжди знаходиться між мінімальним і максимальним значеннями ( тому модель можна ефективно застосовувати тільки до ряду даних, що не має лінійного тренда. На рис. 4.3 показана модель для ряду рt, при k = 5.

 

 

Рисунок 4.3 – Модель ковзного середнього при k = 5

 

Ми бачимо, що графік моделі більш гладкий, ніж початковий. При усереднюванні частково зникли флуктуації початкових даних, викликані випадковими чинниками. На графіку моделі відсутні перші п'ять значень. Це викликано тим, що для моментів часу t = 2, 3, 4, 5, 6 у формулі (4.4) значення рt не визначені.

Прогноз не враховує можливих коливань, або, як то кажуть, обурень, що мають місце в процесі. Отже цей прогноз слід розуміти як деяке усереднене значення можливих майбутніх значень.

Щоб одержати прогноз, який враховував би такі обурення, потрібно навчитися визначати їх яким-небудь іншим способом. Прикладом такого підходу є знаходження сезонних компонент.

Для того, щоб знайти прогнози на більш видалені в майбутнє квартали, відсутні члени у формулі (4.4) замінюють на відповідні одержані раніше прогнози.

Модель експоненційно зваженого ковзного середнього (exponentiallyweightedmovingaverage (EWMA) model) є природним узагальненням моделі ковзного середнього. Вона будується на наступних двох припущеннях.

Кожне нове значення визначається сукупністю всіх попередніх значень.

Вплив попередніх даних слабшає в геометричній прогресії, у міру того як вони відстають далі за часом.

Якщо виходити з вищесказаного, то модель EWMA повинна визначатися формулою:

(4.5)

Проте при визначенні коефіцієнтів при Yt-1 потрібно також, щоб їх сума дорівнювала одиниці. В цьому випадку вони називаються вагами. Оскільки сума коефіцієнтів при Yt-1 в правій частині формули приблизно дорівнює ( ): , при достатньо великих n, то модель EWMA визначається наступною формулою:

 

(4.6)

 

Тепер сума коефіцієнтів: . З формули (4.6) можна зробити дуже важливий висновок про пам'ять моделі EWMA, тобто про вплив попередніх даних на значення моделі. Чим ближче α до нуля, тим швидше модель «забуває» минулі дані і тим більшу вагу має сама остання інформація. З другого боку, коли α наближається до одиниці, то вага при Yi розподілені більш рівномірно і, отже, графік моделі виглядатиме більш згладженим.

Неважко бачити, що формула (4.6) еквівалентна наступній формулі:

 

(4.7)

 

Формула (4.7) більш зручна для обчислень, в порівнянні з формулою (4.6), тому для визначення значень моделі краще використовувати саме її. Число (1- α) називається константою згладжування. Коли а = 0, формула (4.7) співпадає з формулою (4.1) для наївної моделі. В правій частині формули (4.7) присутній член аYt-1. Це означає, що обчислення значень моделі носить рекурсивний характер. З (4.7) також витікає, що модель EWMA слід застосовувати тільки для рядів, що не мають тренда.

Розглянемо модель EWMA на прикладі залишків лінійної регресії. Її можна записати в наступному вигляді:

(4.8)

 

Для того, щоб модель можна було застосувати, потрібно задати значення а і перше значення моделі.

Потрібно відзначити один дуже істотний недолік моделей згладжування. На зміни в ході процесу вони реагують із запізненням. Пояснимо це з допомогою діаграми 4.4.

 

 

Рисунок 4.4 – Модель EWMA

 

Спадання даних відбувалося аж до 3-го кварталу. Починаючи з 4-го кварталу картина починає поступово мінятися у бік зростання. Невеликий відступ вниз відбувся в 5-у кварталі, а потім аж до 8-го кварталу графік йшов вгору. Подивимося, як на це реагувала наша модель. Вона продовжувала йти вниз аж до 6-го кварталу. Але після того, як її графік почав нарешті зростати, це зростання продовжувалося аж до 13-го кварталу, тобто до того моменту, коли графік початкових даних різко пішов вниз. Пояснити цей факт можна характером формули (4.6), в якій значення моделі визначаються в основному декількома попередніми даними.

Як вже говорилося раніше, вид графіка моделі залежить від величини а. При порівнянні двох діаграм, зображених на рис. 4.5, неважко помітити, що графік моделі при більшому значенні (а = 0,8) має велику згладжену, тоді як графік знизу (при а = 0,2) слідує за початковими даними набагато щільніше. Також значно відрізняються і прогнозовані значення.

 

 

Рисунок 4.5 – Модель EWMA ( 1 = 0)

 

Модель експоненціального згладжування (exponentialsmoothingmodel) задається формулою:

(4.9)

 

Вираз (4.9) відрізняється від формули (4.7) моделі EWMA лише заміною Yt-1 на Yt в правій частині. Насправді модель експоненціального згладжування виходить з моделі EWMA шляхом зсуву початкових даних на одиницю часу. Модель експоненціального згладжування дає прогнози, мало відмінні від тих, що одержані за допомогою моделі EWMA.

Модель подвійного експоненційного згладжування (doubleexponentialsmoothingmodel) виходить за допомогою подвійного застосування моделі експоненційного згладжування. Тобто спочатку модель експоненційного згладжування застосовується до початкових даних, а потім – до змодельованих значень, одержаних на першому етапі. При цьому при повторному застосуванні моделі можна узяти інше значення а.

Для вибору відповідного значення а прогнозист звичайно керується або інтуїцією, або попереднім досвідом. Більш строгий підхід полягає в наступному. Оскільки кожна експоненціальна модель визначається своїм значенням а, то можна розглядати всю сукупність експоненціальних моделей для даного ряду даних. Таким чином, а вважається параметром моделі. Тепер можна знайти оптимальне значення а, що мінімізує суму квадратів залишків, тобто поступимо точно так, як ми робили в першому розділі для знаходження параметрів кривої підгонки.

Тут важливо пам'ятати, що оскільки оптимальне а визначається на основі всього ряду даних, то відповідні expost значення а не зобов'язані співпадати і їх потрібно знаходити окремо на кожному кроці. Хорошого прогнозу слід чекати при стабільних значеннях а, тобто коли expost значення аутворюють невеликі коливання навколо деякого середнього значення.

Комбінована модель. Для даних знаходиться лінійне рівняння регресії. Потім моделюються залишки моделі лінійної регресії за допомогою моделі EWMA. Знаходиться оптимальне значення а. Потім об'єднуються ці дві моделі.

Значення комбінованої моделі . Прогнози будуються шляхом складання майбутніх значень тренда і прогнозів залишків, одержаних за допомогою моделі EWMA. Діаграма комбінованої моделі представлена на рис. 4.6.

Вона краща моделює початкові значення, ніж лінія тренда. Залишки комбінованої моделі для Y рівні відповідним залишкам моделі EWMA для е.

 

 

Рисунок 4.6 – Комбінована модель (лінійна регресія + модель EWMA)

 

Тому MSE (середньо квадратична похибка) моделі буде така ж, як у моделі EWMA для залишків еi. При expost прогнозуванні комбінованої моделі слід враховувати, що, оскільки лінійне рівняння регресії змінюватиметься на кожному кроці, змінюватимуться і помилки моделі, а отже – і оптимальне значення а.

4.4 Визначення початкових значень моделі

Оскільки формула (4.7) є рекурсивною, тобто для обчислення значення моделі у момент t ми повинні знати її значення в попередній момент t - 1, то перед нами встає задача визначенняпочаткових значень моделі (в даному випадку у момент часу t= 1). Дійсно, формулу (4.7) можна застосувати тільки тоді, коли t > 1. Але якщо ми не знаємо ,ми не зможемо знайти і т.д. Задача визначення початкових значень часто зустрічається в прогнозуванні. У частині моделей згладжування вплив початкового значення моделі залежить від величини а і від довжини n ряду початкових даних. Чим ближче а до одиниці, тим більше помітною буде дія початкової умови як на значення моделі, так і на прогноз. В той же час зважаючи на здатність моделі «забувати» попередні дані вплив початкового значення моделі слабшає із збільшенням довжини ряду даних.

Найпростіший спосіб – узяти як початкове значення або .

У сучасному прогнозуванні досить поширений метод прогнозування назад (backcasting). Наприклад, можна розглянути модель, подібну моделі (4.7), з тією лише різницею, що рекурсивність здійснюється у зворотному напрямі:

 

(4.10)

 

Значення t беруться в зворотному порядку. Як початкове значення для моделі (4.10) береться саме останнє за часом значення Yn. Після того як значення , моделі (4.10) визначено, ми знову повертаємося до початкової моделі (4.7). Значення моделі (4.10) полягає в тому, щоб як початкове значення узяти згладжене, визначуване загальним ходом процесу, число. Наприклад, якщо на початку процесу відмічалися значні коливання, то тепер для визначення остаточного прогнозу вони не виконуватимуть істотної ролі. Можна було б подумати, що в результаті ми повернемося до того ж значенню Yn. Але це не так. Рівняння (4.10) можна записати в наступному вигляді:

 

(4.11)

 

Процес прогнозування здійснюється таким чином. Знаходиться значення згідно формули (4.10), рухаючись вгору, починаючи з останнього значення. Таким чином, знаходиться згладжене значення , відповідне 1-му кварталу. Потім переходимо до моделі (4.8) з набутим початковим значенням. Приклад прогнозування назад представлений на рис. 4.7.

 

Рисунок 4.7 – Модель прогнозування назад

 

Початкове значення моделі можна визначити за допомогою кривої підгонки. Оскільки еi є залишками моделі лінійної регресії, то їх коефіцієнт b2 буде рівний нулю і лінійне рівняння регресії зведеться до тотожності .

Коли є достатня кількість інформації, її можна розбити на дві групи. Потім значення прогнозу моделі для першої групи можна використовувати як початкове значення моделі для другої групи. Як початкове значення для першої групи можна узяти або . У обох групах беруться оптимальні значення а.

Початкове значення можна взяти відповідно до досвіду і розуміння прогнозистом процесу.

Найкращий спосіб визначення початкових значень, особливо для прогнозистів, що починають, полягає у виборі опції, «автоматично» присутньої у всіх статистичних пакетах.

 

4.5. Моделі згладжування з трендом: модель Холта, модель Брауна.

Модель Холта

В лінійній моделі різниця дорівнювала b2, тобто служила характеристикою наявного тренда. Звичайно, було б невірним припускати, що в рівнянні (4.9) відповідна різниця буде константою. Проте вираз може розглядатися як величина тренда для нашого процесу в даний момент часу.

Застосуємо модель експоненціального згладжування до різниць , з константою згладжування, рівною 1 – β, де 0 ≤ β< 1. При цьому значення моделі позначимо як Тtі назвемо їх значеннями тренда. Таким чином, одержуємоперше рівняння Холта:

(4.12)

 

Основна ідея Холта полягала в тому, щоб при визначенні формулі (4.9) додати до попереднього значення моделі відповідне значення тренда Tt-1. Отже, одержуємо друге рівняння Холта:

 

(4.13)

 

Побудова моделі зводиться до трьох основних етапів.

1. Ухвалюють рішення щодо величин параметрів моделі α і β. Якщо немає особливих переваг, то оптимальні значення α і βвизначають як завжди, виходячи з мінімізації MSE.

2. Визначають початкові значення і Tt. Що ж до Tt., то можна узяти

Т1 =2 + Δ4 )/2.

3. Поперемінно знаходять і Tt. При цьому спочатку обчислюють і лише потім – Tt.

Для прогнозу на mкроків вперед, який позначимо Рп+m, використовується третє рівняння Холта:

(4.14)

 

Іншими словами, передбачається, що останнє значення тренда залишається незмінним для всіх майбутніх прогнозів.

Діаграма моделі Холта представлена на рис. 4.8.

 

Рисунок 4.8 – Модель Холта, включаючи прогнози на три квартали вперед

 

Як ми бачимо, ця модель досить добре апроксимує початкові дані.

Модель подвійного експоненціального згладжування з трендом (модель Брауна – Brown'sdoubleexponentialsmoothingmodelwithtrend).

Модель Брауна користується популярністю у менеджерів, завдяки своїй простоті і непоганим короткостроковим прогнозам. Ідея полягає в наступному. При згладжуванні графік моделі знаходиться, як правило, нижче графіка даних при їх зростанні. При спаданні даних ми маємо зворотну картину. При повторному згладжуванні ця різниця стає ще відчутнішою.

Для отримання точнішої моделі для початкових даних Браун запропонував до значення моделі простого експоненціального згладжування додавати різницю в значеннях між простим і подвійним згладжуванням, помножену на коефіцієнт, обернено пропорційний а. Таким чином, модель Брауна визначається наступною формулою:

(4.15)

 

Прогноз на h кроків вперед визначається формулою:

 

(4.16)

 

При h = 1 ми одержуємо . Оскільки у формулі (4.15) значення визначаються на основі попередніх значень даних, то значення моделі також є ex post прогнозами.

Значення а можна визначити шляхом мінімізації MSE. Змодельовані значення моделі Брауна приведені на рис. 4.9.

 

Рисунок 4.9 – Модель Брауна, включаючи прогноз

 

Помітних поліпшень в порівнянні з моделлю Холта не спостерігається.

 

4.6 Сезонні моделі

Процес, що має кількісні характеристики, визначається наступними трьома основними чинниками: тренд (Т), сезонність (S) і випадкова помилка (е). Трендовий чинник іноді називають також трендоциклічним. Тоді як трендовий чинник відповідальний за загальну тенденцію процесу, сезонний чинник пов'язаний з впливом певних часових інтервалів на бізнес-процес. Тут важливо пам'ятати, що «сезон» в прогнозуванні є технічним терміном і не обов'язково означає квартал. Ось декілька найхарактерніших прикладів показників, відповідних різним сезонам:

1) об'єм продажів одягу по кварталах;

2) кількість заявок в туристичній фірмі по місяцях;

3) завантаженість наземного транспорту в місті по днях тижня;

4) кількість покупців в супермаркеті по годиннику.

Третій випадковий чинник, званий також помилкою, з'являється як результат непередбачених обставин. У нашому першому прикладі це могла бути надзвичайно холодна зима або зміна менеджменту компанії. Часто буває, що випадкові чинники проявляють себе в абсолютно несподіваній і непередбаченій манері. Наприклад, це може бути падіння або, навпаки, зліт цін на нафту на світових ринках. А на туристичний бізнес можуть робити вплив політичні події або стихійні лиха в іншій частині миру. Навіть подальший аналіз не завжди здатний виявити всі ті чинники, які могли вплинути на процес.

Величина:

(4.17)

 

називається десезоналізованим значенням. Тут S– сезонний чинник (його називають також сезонним коефіцієнтом), відповідний моменту часу t . Кажучи менш формальною мовою, десезоналізовані дані – це ті гіпотетичні значення, які могли б прийняти наші дані, якби не було сезонних впливів.

З формули (4.17) виходить:

(4.18)

 

Іншими словами, початкові дані є добутком своїх десезоналізованих значень і сезонних чинників. З формули (4.17) також слідує формула:

 

(4.19)

 

Задача полягає в тому, щоб знайти сезонні чинники Sі. Але для цього необхідно спочатку визначити dt.

З формули (4.19) виходить очевидний, але важливий результат: всі коефіцієнти сезонності не можуть одночасно бути більше або, навпаки, менше одиниці. Інакше їх сума не буде рівна чотирьом.

Для знаходження десезоналізованих значень ми поступимо так само, як поступали при побудові моделі ковзного середнього. Щоб нейтралізувати сезонні впливи, порядок ковзного середнього k береться рівним 4. Щоб нейтралізувати вплив тренда, ми розміщатимемо кожне ковзне середнє у середині відповідної групи. Числа, що є десезоналізованими значеннями в першому наближенні, ми позначимо d'.

На даний момент ми ще не можемо скористатися формулою (4.10) для знаходження сезонних компонент, оскільки немає точної відповідності між початковими і десезоналізірованними даними. Ця проблема легко розв'язується шляхом утворення центрованих ковзних середніх другого порядку. Ці дані ми позначили d", які виходять шляхом додаткового згладжування десезоналізованих значень і, природно, так само будуть десезоналізованими значеннями для початкових даних. Тепер можемо застосувати формулу (4.19), щоб одержати коефіцієнти сезонності.

Для того, щоб набути однакові значення сезонних чинників за одні і ті ж квартали різних років, сезонні значення сортуються по кожному кварталу по роках, а потім знаходяться їх середні.

Числа і приймаються за остаточні значення для сезонних чинників. Тепер ми знайдемо остаточні десезоналізовані значення.

На рис. 4.10 можна побачити початкові значення до і після десезоналізації.

 

 

Рисунок 4.10 – Початкові значення до і після десезоналізації

 

Як бачите, піки і западини, викликані сезонними впливами, після десезоналізації зробилися менш помітними. Тепер підсумовуємо все вищесказане у вигляді алгоритму.

Алгоритм для знаходження сезонних чинників і десезоналізованих значень:

- знаходимо ковзні середні d'1-го порядку для початкового ряду Yt;

- знаходимо (центровані) ковзні середні d" 2-го порядку для ряду d't;

- знаходимо неусереднені коефіцієнти сезонності ;

- усереднюємо значення S', щоб одержати коефіцієнти сезонності S1, S2,S3 і S4;

- знаходимо остаточні десезоналізовані значення dt.

Тепер ми можемо побудувати сезонну модель S. Робиться це таким чином. Спочатку визначається яка-небудь модель для десезоналізованих значень. Наприклад, як таку модель ми можемо узяти одну з кривих підгонки. Потім значення моделі множаться на відповідні коефіцієнти сезонності. Набуті значення дадуть нам сезонну модель.

Тепер, щоб одержати сезонну модель S, ми помножимо значення моделі на відповідні коефіцієнти сезонності. На рис. 4.11 представлені початкові дані і змодельовані значення St.

 

 

Рисунок 4.11 – Графік сезонної моделі

 

Прогноз визначається: спочатку ми повинні визначити прогноз для відповідного значення тренда, який помножимо на коефіцієнт сезонності, відповідний певному кварталу.

 


Лекція 5 «Парна регресія в прогнозуванні соціально-економічних процесів»

Анотація

Лінійне рівняння регресії. Прогнозування в умовах невизначеності: тест рекурсивної оцінки коефіцієнтів регресії; тест рекурсивної оцінки значень Y; тест рекурсивної оцінки помилок регресії. Застосування матриць до моделі лінійної регресії.

 

5.1 Лінійне рівняння регресії

Припустимо, що члени ряду Y1, Y2, ..., Yn є реалізацією взаємно незалежних ідентичних нормальних випадкових величин, і члени ряду представлені нормальними випадковими величинами. Найбільш проста модель при цьому вийде, якщо припустити, що члени ряду мають одне й те ж стандартне відхилення, рівне σ, але відрізняються значеннями своїх математичних сподівань E(Yi). Зазвичай припускається, що E(Y) залежить від деякої величини X. Якщо ця залежність лінійна, то модель називається моделлю [парної] лінійної регресії. Коефіцієнти лінійного рівняння регресії приймаються за наближені значення коефіцієнтів моделі. У такому випадку:

 

(5.1)

 

де і = 1, 2, ..., n;

β1, β2– не залежитьвід і, тобто являються константами моделі.

Ми отримаємо інше, більш поширене визначення моделі [парної] лінійної регресії, якщо зауважимо, що будь-яка випадкова величина Y з математичним очікуванням μ і стандартним відхиленням σ може бути представлена як Y = μ + ε, де випадкова величина ε має математичне сподівання, рівне нулю , і стандартне відхилення σε = σ.

Отже, статистична модель

 

, (5.2)

 

де і = 1, 2,..., n;

Yi – випадкова величина;

Xi - константа;

ε1, ε2, ..., εn – нормальнівипадкові величиниз одним і тим же математичним сподіванням, рівним 0, та стандартним відхиленням σ;

β1, β2 – константи моделі, що не залежатьвід і, називається моделлю [парної] лінійної регресії.

Параметри β1, β2 називаються коефіцієнтами регресії. Випадкові величини ε1, ε2, ..., εn називаються випадковими членами або помилками. Присутність випадкових членів в моделі означає, що залежність між Y і X не є строго лінійною. Ми також додатково припустимо, що ε1, ε2, ..., εn є взаємно незалежними випадковими величинами. Причому X називається регресором, а Y - залежною змінною. Коли ми говоримо, що Xi - константа, то мається на увазі, що вона є такою при фіксованому і, а при різних і X може приймати різні значення. Ми розглядаємо Yi як випадкову величину для фіксованого i. Якщо i ≠ j, то Yi і Yjбудуть різними випадковими величинами з різними математичними очікуваннями, рівними β1 + β2Хi і β1 + β2Хj відповідно, хоча і з однаковими стандартними відхиленнями, рівними σ.

Важливо відзначити, що в моделі (5.2) коефіцієнт β2 дорівнює середньому зміни в Y при збільшенні X на одиницю. Дійсно,

 

, де і = 1, 2, … , n.

2. Якщо Xi = і2, то залежність Y від часу буде квадратичною:

, де і = 1, 2, … , n.

3. Якщо припустити, що Хi = Ln (і), то виходить логарифмічна модель:

, де і = 1, 2, … , n.

4. Розглянемо наступну модель, яку називають моделлю постійної еластичності:

, де і = 1, 2, … , n.

Вона буде еквівалентна моделі:

, (5.3)

 

яку використовують при побудові 95%-них інтервалів прогнозу для значень Y. Він дає досить чітке уявлення про те, наскільки даний процес слідує моделі лінійної регресії. Тут, як і в попередньому тесті, ми задаємо число k в діапазоні 0 <k < n і потім за допомогою формули (5.3) визначаємо 95%-ний інтервал прогнозу Δк +1 для Yk +1, при заданих значеннях пар даних (X1, Y1), (X2, Y2),..., (Xk, Yk). Нагадаємо, що серединою інтервалу Δк +1 є expost прогноз. Випадкова величина Yk +1 з ймовірністю 95% повинна опинитися в інтервалі Δк +1. Потім ми додаємо пару даних (Xk+l, Yk+l) і повторюємо всю процедуру для k + 1 пар даних (X1, Y1), (X2, Y2),..., (Xk+1, Yk+1) і т.д. В результаті ми отримаємо рекурсивні інтервали Δk+1, Δk+2, ..., Δn. Серединою кожного такого інтервалу Δi буде значення expost прогнозу. Відповідні 95%-ні рекурсивні інтервали прогнозу для значень Y наведені на рис. 5.2.

 

Рисунок 5.2 - 95%-і рекурсивні інтервали прогнозу для значень Y

 

Примітка. Окреслена напівжирним лінія в середині смуги відповідає даним за останні 5 кварталів.

Пунктирна лінія на рис. 5.2 показує значення expost прогнозів. І хоча вихідні дані з ними не збігаються, вони потрапляють в смугу, задану відповідними 95%-ними рекурсивними інтервалами прогнозу. Цей тест підтверджує висновок, отриманий в результаті розглянутого раніше тесту рекурсивної оцінки коефіцієнтів регресії, про те, що дані, можливо, слідують моделі лінійної регресії.

Зазвичай замість тесту рекурсивної оцінки значень Y, який ми тільки що вивчили, розглядається еквівалентний йому тест рекурсивної оцінки помилок регресії. Якщо ми позначимо довжину 95%-ного рекурсивного інтервалу прогнозу Δk як 2Lk, то формула (5.3) може бути записана в наступному вигляді:

 

. (5.4)

 

Нерівність (5.4) еквівалентна твердженню, що помилкаехpost прогнозування зймовірністю 95% повинназнаходитись в інтервалі: .

Як іу вище описаних тестах, тут задають число k в діапазоні 0 < k < n, а потім послідовно знаходять 95%-ніінтервали прогнозу [-Lk+1; Lk+1], [–Lk+2; Lk+2], ..., [-Ln; Ln] для помилок еk+1, ek+2, ..., еn. На рис. 5.3 представлені результати тесту рекурсивної оцінки помилок регресії.

 

 

Рисунок 5.3 – Помилки expost прогнозів і відповідні 95%-ні рекурсивні інтервали прогнозу для помилок е

 

На рис. 5.3 дві пунктирні лінії, розташовані симетрично відносно горизонтальної осі, представляють границі 95%-них рекурсивних інтервалів прогнозу для помилок еі. Самі помилки представлені лінією між ними. Хоча значення помилок і не виходять за межі смуги, прогнозист може вирішити, що вони занадто великі.

У більшості випадків вони складають більше 10% від відповідних значень Y. Він може вирішити, що для отримання більш точного прогнозу потрібно врахувати вплив економічних та інших умов.

 

5.3 Застосування матриць до моделі лінійної регресії

Детермінований матричний предиктор має сенс будувати в тих ситуаціях, коли можливість застосування статистичних методів моделювання повністю виключена. Прикладом може служити ситуація, в якій дослідник володіє всього двома, трьома спостереженнями. Щоб перейти до формального опису моделі з таким предиктором, введемо позначення:

Хti – величина i-го показника у момент часу t;

Xt-1i– величина i-го показника у момент часу t-1;

ti – величина зміни (приросту) i-го показника.

Далі природно припустити, що будь-яка зміна довільного i-го показника залежить від величини решти показників. Це може бути функціональна або регресійна залежність. Розглянемо випадок, коли малий об'єм ретроспективних даних не дозволяє реалізувати відомі методи ідентифікації цієї залежності. Єдино доступною альтернативою ідентифікації в подібній ситуації є підхід, заснований на значному спрощенні цієї залежності. В якості такої спрощеної форми зручно використовувати лінійне представлення приростів. Відразу помітимо, що модель, побудована за двома спостереженнями, не може претендувати на застосування для розрахунків, поширюваних за рамки, обкреслені короткостроковими прогнозами. Тому при розгляді короткострокових періодів таке спрощення не приводить до значного зростання помилки прогнозування навіть у тому випадку, коли істинна залежність явно нелінійна.

Модель цієї простої (лінійної) залежності будується в припущенні, що приріст будь-якого з показників формується під впливом всіх остаточних, будучи як би сумарною величиною, причому кожен показник окремо робить незначний вплив, і серед них немає домінуючих. Для реалізації цього припущення вводиться в розгляд характеристика, що встановлює ступінь впливу j-гo показника на зміни, що відбуваються в і-му. В якості такої характеристики зручно використовувати непрямий темп приросту

 

 

Якщо умовитися, що на формування приросту всі показники надають рівномірну дію, то, розділивши nij на (n–1), одержимо ту частку в прирості i-го показника, яка сформована під впливом j-го. Використання введеної міри ступеня впливу j-го показника на i-й дозволяє виразити приріст Dхt через суму добутків

 

 

 

Враховуючи, що Dхti = xti – xt–1 можна величину будь-якого і-го показника представити у вигляді суми попереднього значення xti і приросту Dхti:

 

.

 

Для одержаної системи рівнянь (5.3), ввівши позначення

 

.

 

можна використовувати компактний матричний запис

.

Вважаючи, що невідомим вектором в цій системі є хt, запишемо його таким чином:

, (5.5)

 

де через I позначена одинична матриця.

Зворотну матрицю (I–V)-1 називатимемо матричним предиктором. Він визначає перехід із стану, описуваного вектором значень попереднього моменту часу, в стан, представлений вектором значень теперішнього моменту часу. Позадіагональні елементи зворотної матриці інтерпретуються як непрямі темпи зростання рівномірно розподілених частин прогнозованих показників, а діагональні – як прямі темпи зростання частини, що залишилася.

У припущенні, що матричний предиктор перспективного періоду майже не відрізняється від матричного мультиплікатора поточного періоду, вираз (5.5) дозволяє розраховувати прогнозні оцінки. Основна перевага даного підходу полягає у тому, що з його допомогою можна проводити розрахунки для багатовимірних рядів динаміки навіть у тому випадку, коли дослідник має в своєму розпорядженні спостереження лише за два періоди. Правда, статистична надійність таких прогнозних розрахунків не перевіряється і спирається, в основному, на ту обставину, що навіть при зміні характеру динаміки прогнозованих процесів структура самого предиктора, як правило, змінюється трохи. Як показує практика прогнозних розрахунків, застосування цієї моделі переважно звичних розрахунків з використанням темпів зростання, в яких зовсім не враховується взаємодія між модельованими показниками.


Лекція 6 «Множинна регресія в прогнозуванні соціально-економічних процесів»

Анотація

Основні властивості множинної регресії. Відбір регресорів. Бета-уявлення. Мультиколінеарність

 

6.1 Основні властивості множинної регресії

Статистична модель

  (6.1)

де i = 1, 2,..., n;

к ≥ 2;

Yi — випадкова величина;

Хi(m), при 2 ≤ m ≤ k, — константа;

ε1, ε2, …, εn — незалежні нормальні випадкові величини з одним і тим же середнім, рівним 0, і стандартним відхиленням σ;

β1, β2, …, βk — не залежать від і константи моделі, називається моделлю лінійної регресії з k – 1регресорами.

Якщо к > 2, то модель (6.1) називається моделлю множинної регресії. Хочаі = 1, 2, ..., n являються просто індексами нумерації, в прогнозуванні вони зазвичай відповідають моментам часу, взятихз однаковим кроком, при цьому допускається, щоб деякі значення і були опущені.

Регресор вважається константою при фіксованому і. Це зауваження справедливе не тільки для випадку з одним регресором, а й при множинній регресії. Таким чином, при різних і значення кожного з регресорів можуть відрізнятися. Якщо і ≠ j, тоді Yi і Yj будуть різними випадковими величинами, які мають математичні очікування, рівні β1 + β2Xi(2) +…+ βkXi(k)іβ1 + β2Xj(2) +…+ βkXj(k) відповідно, і однакові стандартні відхилення, рівні σ.

Звертає на себе увагу той факт, що у формулі (6.1) відсутня X(1). Справа в тому, що при вивченні різних властивостей моделі (6.1) зручно вважати, що X(1) тотожно дорівнює одиниці (1) ≡ 1). Тому модель (6.1) часто записується у вигляді:

, (6.2)

 

де і = 1, 2, ..., n;

к ≥ 2.

При цьому, як уже сказано, Хi(1) ≡ 1 для всіх і. Добавимо ще одну умову, яка формулюється наступним чином:

Ні одна із змінних Х(1), Х(2),..., Х(k) не являється лінійною комбінацією інших.

З (6.1) випливає, що E(Yt) = β1 + β2Xi(2) +…+ βkXi(k). Таким чином, так же, які увипадкуз одним регресором, модель лінійної регресії з довільним числом регресорів ми могли б визначити як лінійну залежність E(Y) від змінних Х(1), Х(2),..., Х(k) з параметрами β1, β2, …, βk, що не залежать від і.

Запишемо формулу (6.1) у вигляді системи рівнянь:

 

  (6.3)

 

Система рівнянь (6.3) може бути записана в матричній формі наступним чином:

 

(6.4)

 

де , — n-вимірні вектори;

k-вимірний вектор;

n×kматриця:

 

(6.5)

 

Змінні Х(2),..., Х(k) називаються пояснюючими, тому що при будь-якому i значення Yi однозначно ними визначено з точністю до випадкового члена εi. У число пояснюючих можуть входити і змінні, які не є заданими функціями часу f(і). У цьому випадку модель називається каузальною.

Визначення оптимальної кількості пояснюючих змінних, що адекватно описують зміни залежної змінної Y, - одне з найбільш важливих завдань, що стоять перед прогнозистом. Завдання це, як ми побачимо надалі, зовсім не просте є скоріше процесом, ніж одноразовим рішенням. Крім чіткого розуміння виробничої діяльності свого підприємства і знання макроекономічних показників прогнозист повинен також добре розбиратися в статистичних властивостях моделі множинної регресії.

 

2. Відбір регресорів.

При підготовці даних прогнозист повинен першза все знайти набір регресорів, здатних вплинути на процес, що генерує величини Y1, Y2, ..., Yn. На наступному етапі він повинен вирішити, які з цих регресорів слід залишити в моделі, тобто визначити регресори, необхідні для прогнозування майбутніх значень Y. Важливим показником оцінки моделі лінійної регресії (6.1) є коефіцієнт детермінації:

 

  (6.6)

 

Буде вірною також наступна формула:

.

Як і у випадку з одним регресором, , оскільки між коефіцієнтами детермінації та кореляції існує наступний зв’язок: , звідки випливає, що .

При додаванні нових регресорів коефіцієнт детермінації R2k практично завжди зростає. Те, що коефіцієнт детермінації R2k не може зменшитися, випливає з того факту, що при скороченні числа регресорів отримана модель є окремим випадком первісної, коли коефіцієнти при відсутніх регресорах дорівнюють нулю. Тому величина R2k не може бути критерієм при вирішенні питання, чи потрібно вводити додаткові регресори в модель.

При визначенні числа регресорів в першу чергу намагаються позбавитися від регресорів, у яких 95%-і довірчі інтервали для відповідних коефіцієнтів можуть містити нулі.

95%-ний довірчий інтервал для коефіцієнта регресії βj буде наступним:

 

  (6.7)

 

де zjjj-й діагональний елемент матриці (М'М)-1.

Так як bj являється лінійною комбінацією нормальних випадкових величин Y1, Y2, ..., Yk, тоді bj також буде нормальною випадковою величиною. Величина називається стандартною помилкою bj, з тим же застереженням, що і для одного регресора.

Зазвичай замість 95%-ного довірчогоінтервалу для βj застосовують інший спосіб, який заснований на розгляді випадкової величини:

Припустимо, що βj = 0. В такому ипадку величина слідує t(n-k)-розподілу. Вона називається t-статистикою для коефіцієнта βj.

Для вихідних даних визначають Р-значення t-статистики для коефіцієнта βj. Воно дорівнює ймовірності того, що випадкова величина, яка слідує t(n-k)-розподілу, прийме значення, що по модулю перевищує абсолютне значення t-статистики. Тобто знаходять:

.

 

Якщо Р-значення менше 5%, тобто , то можна бути по крайній мірі на 95% впевненим, що βj ≠ 0. Якщо ж , то коефіцієнт bj не являється статистично значимим і регресор X(j) виключають з рівняння лінійної регресії.

Як визначити, чи збільшився коефіцієнт детермінації на стільки, щоб можна було залишити нові регресори в моделі? Для цього замість r2 розглядають скоригований коефіцієнт детермінації:

 

 

 

Скоригований коефіцієнт детермінації часто використовується, коли потрібно вирішити, чи слід додавати додаткові регресори в модель. Нові регресори додають за умови, що скоригований коефіцієнт детермінації збільшився. При практичному прогнозуваннізазвичай роблять навпаки. Спочатку вводять повний набір регресорів в комп'ютер і, після того як програма залишила тільки ті регресори, довірчі інтервали яких не містятьнулі, починають по черзі виключати регресори, у яких t-статистика не більше одиниці.

При порівнянні моделей з різним числом регресорівв прогнозуванні використовуються також два інших коефіцієнта – критерій Шварца:

 

 

 

та інформаційний критерій Акайка:

 

 

Як і скоригований коефіцієнт детермінації, обидва цих коефіцієнта призначені для того, щоб «карати»за включення в модель регресорів, що не призводять до значного підвищення здатності моделі описувати процес. Але на відміну від, рішення про те, щоб залишити нові регресори в рівнянні, приймають тільки при зменшенні SC або АIС.

 

6.3 Бета-уявлення

При вивченні рівняння регресії може виникнути також проблема, пов'язана з системами одиниць, в яких виражений той чи інший регресор. Наприклад, якщо ми представимо значення Y, Х(2), Х(3) в доларах, то рівняння регресії буде виглядати наступним чином:

 

 

де і = 1, 2, ..., 17.

Якщо порівняти отримане рівняння з рівнянням , то помітимо, що коефіцієнти b2 і b3 не змінились, а коефіцієнти b1 та b4 збільшились, кожний в 1000 разів. Для того щоб коефіцієнти регресії не залежали від масштабу, розглянемо рівняння регресії:

 

, деσj – стандартне відхиленняX(j). Коефіцієнти β*2, ..., β*k називаються коефіцієнтами «бета». Коефіцієнти «бета» розраховуються в більшості статистичних пакетів при визначенні рівняння регресії. Легко помітити, що . Дійсно, при підстановці коефіцієнтів β*2, ..., β*k в рівняння (6.8) ми знову отримаємо рівняння регресіїу формі відхилень від середніх. Так як стандартизовані значення у', х'(2) ,..., х'(k) не залежать від масштабу вихідних змінних, то звідси слідує, що коефіцієнти «бета» також не залежать від масштабу. Щоб зрозуміти важливість рівняння (6.8) для прогнозування, припустимо, що всі регресори є незалежними нормальними випадковими величинами. Ми зараз розглядаємо регресори як випадкові величини, тоді як при визначенні рівняння лінійної регресії було ясно сказано, що регресори являються константами. Справа в тому, що для кожного моменту часу і реалізація регресор X буде константою, в той час як сам регресор являється випадковою величиною і гіпотетично може приймати різні значення. В такому випадку стандартизовані регресори х'(2), ..., х'(к) будуть рівноцінними в тому сенсі, що всі вони слідують одному й тому ж t(n-1)-розподіл. Тому їх вплив на зміни в значеннях Y визначається виключно величинами відповідних коефіцієнтів «бета». В дійсності через випадковий фактор буде існувати невелика кореляція між регресорами, яка відіб’ється на значеннях коефіцієнтів «бета».   6.4 Мультиколінеарність Так як коефіцієнти b1, b2, ..., bk являються лише статистичними оцінками істинних, хоча і не спостережуваних коефіцієнтів β1, β2, …, βk, то через фактори випадковості перші можуть значно відрізнятися від других, що, в свою чергу, може стати причиною поганого прогнозу. Іншими словами, процес адекватно описується моделлю лінійної регресії навіть, можливо, з малою величиною σε = σ, а прогноз виявляється поганим. Причина тут, як правило, чисто статистична, звана мультиколінеарністю. При expost прогнозуванні коефіцієнт при регресорі значно змінювався. Для цьогоє дві основні причини. По-перше, бізнес-процес може взагалі не слідувати моделі лінійної регресії. По-друге, стандартнівідхилення коефіцієнтів b1, b2, ..., bk можуть бутидуже великими, що, в свою чергу, означає, що їх числові значення зважаючи на випадковий характер процесу здатні з досить високим ступенем ймовірності приймати значення, що істотно відрізняються від параметрів системи β1, β2, …, βk. Основною причиною великих стандартних відхилень коефіцієнтів b1, b2, ..., bk являється мультиколінеарність. Мультиколінеарністю називається вплив статистичної лінійної залежності між регресорами на стандартні відхилення коефіцієнтів регресії. Так як зазвичай хоча б один із коефіцієнтів детермінації R(j)2k-1 при j = 2, …, k, то мультиколінеарність в тій чи іншій мірі завжди присутня в моделі множинної регресії. Щоб зрозуміти, якої шкоди може завдати мультиколінеарність, припустимо, що у нас є модель, яка досить добре описує бізнес-процес. Що станеться, якщо прогнозист, який бажає вдосконалити модель, вирішить додати ще один регресор, який має значну статистичну лінійну залежність від початкових регресорів? Оскільки додавання нового регресора може тільки збільшити коефіцієнт детермінації, то він зробить помилковий висновок про те, що нова модель є більш точною.Однак через мультиколінеарність прогноз, швидше за все, виявиться абсолютно невірним. Чи існують способи, що дозволяють позбутися від мультиколінеарності? Прогнозист може виключити з моделі регресори з невиправдано великими стандартними помилками. При цьому можуть бути виключені окремі регресори, вплив яких необхідно враховувати для розуміння процесу. Так що ми маємо тут дві тенденції з діаметрально протилежним ефектом. З економічної точки зору регресор може виявитися істотним для отримання більш адекватної моделі, але з суто статистичних причин його включення може створити проблеми, пов'язані з мультиколінеарністю. По всій видимості, кращим виходом з положення тут могло б стати застосування expost прогнозування, яке дозволить виявити модель, що забезпечує найкращі результати. Існує тісний зв'язок між мультиколінеарністю, числом регресорів і кількістю спостережень, яку також потрібно враховувати при прогнозуванні. Розглянемо матрицю:     Якщо n < k, то ранг матриці М буде менше, ніж k. У такому випадку n-мірні вектори 1, Х(2), Х(3),..., Х(k) будуть лінійнозалежні (тут 1- вектор, що складається з одиниць). Наприклад, якщо n = 2 і k = 3, це означає, що будь-які три вектори на площині будуть лінійно залежні. Тому при визначені моделі лінійної регресії має дотримуватися умова: n > k. Але при малих значеннях різниці (n - k) статистична залежність між векторами буде досить значна, що стане причиною мультиколінеарності. Звідси можна зробити два дуже важливих висновки: - прималій кількості спостережень число регресорів має бути невеликим; - по можливості слід збільшувати число спостережень. Розбиття часових інтервалів на більш дрібні не гарантує підвищення точності прогнозу. Отримані значення представляють собою нові, хоча і тісно пов'язані з первісними, випадкові величини.   ЛЕКЦІЯ 7 «Експертні методи прогнозування» Анотація Сутність і різновидність експертних методів. Методи індивідуального і групового експертного оцінювання. Організація і проведення експертного опитування. Види експертних оцінок.   Методи експертних оцінок використовують для аналізу об’єктів і проблем, розвиток яких цілком або частково не підлягає математичній формалізації, тобто для яких важко розробити адекватну модель. Це пояснюється:  невизначеністю та складністю прогнозованих явищ;  необхідністю кількісно оцінити події, для характеристики яких бракує необхідної інформації й чіткого знання тенденцій розвитку ситуації;  необхідністю враховувати не тільки об’єктивні тенденції розвитку ситуації, а й реакцію учасників подій на рішення, що приймається. Типовими проблемами, які потребують проведення експертизи, є, зокрема такі: визначення мети розвитку об’єкта управління; прогнозування; розроблення сценаріїв; генерування альтернативних варіантів розв’язків; розроблення системи кількісних оцінок; визначення рейтингів тощо. У всіх цих випадках доводиться звертатися до думки експертів. Експерт — це компетентний фахівець із певного питання, чиї оцінки та судження з приводу об’єкта експертизи враховують під час прийняття рішення. Прогнозоване експертне оцінювання відбиває індивідуальні погляди фахівців стосовно перспектив розвитку об’єкта й ґрунтується на мобілізації фахового досвіду та інтуїції. Під експертизою розуміють проведення вимірювань певних характеристик об’єкта до прийняття рішення.   7.1 Сутність і різновидність експертних методів Експертні методи - методи, засновані на думках експертів у даній галузі знань з наступною обробкою отриманих результатів з метою виявлення основних критеріїв і тенденцій, властивих об'єкту. Експертні методи розділяються на два підкласи: 1) прямі експертні оцінки; 2) експертні оцінки зі зворотним зв'язком. Прямі експертні оцінки будуються за принципом одержання і обробки незалежної узагальненої думки колективу експертів (чи одного з них) при відсутності впливу на кожного експерта думок іншого експерта і всього колективу. Експертні оцінки зі зворотним зв'язком у тому чи іншому вигляді реалізують принцип зворотного зв'язку на основі впливу на оцінку експертної групи (одного експерта) думок, що отримані раніше від цієї групи. Експертні методи в прогнозуванні застосовуються в таких випадках: - при відсутності доволі представницької і достовірної статистичної характеристики об'єкта; - великої невизначеності середовища функціонування об'єкта для тих галузей промисловості, що зазнали сильного впливу нових відкриттів; - дефіциті часу; - в екстремальних ситуаціях. Широке застосування експертні оцінки знаходять при прогнозуванні основних напрямків науково-технічного прогресу, суспільної і політичної сфер діяльності.   7.2 Методи індивідуального і групового експертного оцінювання До складу індивідуальних експертних оцінок входять: - метод "інтерв'ю", при якому здійснюється безпосередній контакт експерта з фахівцем за схемою "питання – відповідь"; - аналітичний метод, при якому здійснюється логічний аналіз якої-небудь прогнозованої ситуації, складаються аналітичні доповідні записки; - метод написання сценарію, що заснований на визначенні логіки процесу чи явища в часі за різних умов. Метод інтерв’ю здійснюється шляхом розповсюдження поштових листівок, телефонних дзвінків або особистих інтерв’ю, він передбачає бесіду прогнозиста з експертом, під час якої прогнозист відповідно до заздалегідь розробленої програми ставить експерту питання стосовно об’єкта дослідження. Головний недолік методу — залежність одержаних даних від суб’єктивізму й відповідальності респондентів, які можуть давати недостатньо продумані відповіді, особливо коли гарантовано анонімність, і респондент не зазнає збитків унаслідок неправильного прогнозу. Часто виникають проблеми ідентифікації респондентів, недвозначного формулювання запитань та одержання достатньої кількості відповідей. Метод ґрунтується на припущенні, що об’єкти опитування сформулювали свої плани на майбутнє, і не трапиться нічого, що могло б змінити ці плани. Аналітичні експертні оцінки передбачають тривалу й ретельну самостійну роботу експерта над аналізом тенденції, оцінювання стану та шляхів розвитку прогнозованого об’єкта. Цей метод дає можливість експерту використати всю потрібну йому інформацію про об’єкт прогнозу. Свої думки експерт оформлює у вигляді доповідної записки. Побудова сценаріїв. Сценарій можна визначити як «виклад альтернативних варіантів майбутнього» або «передбачувану послідовність подій за допустимих умов». Він виглядає як хронологія майбутніх змін, зокрема містить деталі зовнішнього середовища, стратегії конкурентів, нові відкриття та дії уряду. Сценарії формулюють як реалістичні можливості, часто із використанням переконливої мови та багатої уяви. Метод аналізу сценаріїв полягає у розгляді кількох різних сценаріїв, які характеризують імовірні шляхи розвитку ситуації. Намір переконати особу, яка приймає рішення, передбачає зваження на чинник невизначеності й розроблення стратегії, придатної за будь-яких обставин. Під час розгляду цілого набору можливостей зменшується ймовірність непередбаченої ситуації. Крім того, експерт усвідомлює внутрішню невизначеність процесу прогнозування, тому остаточно не впевнений у доцільності жодного із варіантів. Головними перевагами розглянутих методів є можливість максимального використання індивідуальних здібностей експертів і незначний психологічний тиск на окремого виконавця. Однак ці методи майже не придатні для прогнозування найзагальніших стратегій через обмеженість знань одного фахівцяексперта про розвиток суміжних галузей науки. Методи колективних експертних оцінок містять у собі: - метод "комісій"; - "колективна генерація ідей" ("мозкова атака"); - метод "Дельфі"; - матричний метод. Ця група методів заснована на тому, що при колективному мисленні, по-перше, більш висока точність результату і, по-друге, при обробці індивідуальних незалежних оцінок, що виносяться експертами, можуть виникнути продуктивні ідеї. 1) У наш час значного поширення набули експертні методи, основані на роботі спеціальних комісій, коли групи експертів за «круглим столом» обговорюють конкретну проблему, щоб узгодити думки й виробити спільне судження. Недолік цього методу полягає у тому, що група експертів у своїх узагальненнях здебільшого керується логікою компромісу. 2)Метод колективної генерації ідей («мозкова атака»). Завдання прогнозування, які вирішують із використанням методів експертних оцінок, містять два формально не пов’язані між собою елементи: визначення можливих варіантів розвитку об’єкта прогнозування та їхню оцінку. Застосування «мозкових атак» у визначенні можливих варіантів розвитку дає змогу швидко одержати продуктивні результати і залучити всіх експертів до активного творчого процесу. Методи «мозкових атак» можна класифікувати за ознакою існування або відсутності зворотного зв’язку між керівником і учасниками «мозкової атаки» в процесі розв’язання певної проблемної ситуації. Наявність зворотного зв’язку дає змогу учасникам концентрувати увагу суто на варіантах, корисних за тим чи тим критерієм для розв’язання проблемної ситуації. Однак штучне введення обмежень унеможливлює бачення всього багатоманіття підходів, тож з рештою можна пропустити оригінальні думки, які мають потенційну, але поки не усвідомлену цінність. Відсутність зворотного зв’язку, тобто максимальна стимуляція висловлювань, передбачає складну й більшу за обсягом роботу на етапі оцінювання їх. Один із варіантів методу «мозкової атаки» — деструктивна відносна оцінка (ДВО) — забезпечує якісне й досить швидке оцінювання варіантів, не обмежуючись при цьому їхньою кількістю. Сутність цього методу полягає в актуалізації творчого потенціалу фахівців під час «мозкової атаки» проблемної ситуації, що реалізує спочатку генерацію ідей і подальше спростування або критику із формулюванням контрідей. 3)Дельфійський метод певною мірою вможливлює організацію статистичного оброблення думок експертів-фахівців і досягнення ними більш або менш узгодженої думки. Цей метод розроблено американською пошуковою корпорацією РЕНД. Свою назву вона отримала від грецького міста Дельфи, відомого завдяки розташуванню тут храму, жерці якого передбачали майбутнє. Дельфійський метод побудований за принципом, згідно з яким у гуманітарних науках думки експертів та суб’єктивні судження мають замінити точні закони причинності природознавчих наук. Підґрунтя цього методу становить багатоетапне узгодження думок групи експертів. Спочатку з’ясовують індивідуальні думки кожного члена групи стосовно ймовірності настання деякої події, наприклад, зростання безробіття в країні впродовж наступних п’яти років. Експерти можуть працювати разом або бути незалежними. Результати опитування збирають і обговорюють провідні фахівці. Авторам найнижчого та найвищого рівнів прогнозу пропонують переглянути свої думки. Після дискусії здійснюють друге опитування із подальшим обговоренням. Процес може повторюватися доти, доки не з’явиться узгоджений прогноз, прийнятний для всіх експертів. В альтернативній версії експерти ніколи не зустрічаються, а їхні думки надсилають поштою (зокрема й електронною) разом зі стислим викладом аргументів. Експертам пропонують переглянути свої прогнози з урахуванням точки зору інших, аж поки не буде досягнуто консенсусу, що, може статися лише після кількох раундів. Дельфійський метод характеризується трьома особливостями, які вирізняють його серед звичайних методів групової взаємодії експертів, а саме: 1. Анонімність експертів, яка полягає в тому, що в процесі процедури експертного оцінювання прогнозованого явища учасники експертної групи не знають один одного. При цьому взаємодія членів групи під час заповнення анкет цілком виключається. У такому разі автор відповіді може змінити свою думку, не оголошуючи про це. 2. Використання результатів попереднього туру опитування. Ця система дає можливість групі фахівців зосередитися на початкових завданнях, а не вигадувати щоразу щось нове. Оскільки групова взаємодія здійснюється безпосередньо шляхом відповіді на анкету, фахівець або організація, які проводять дослідження за дельфійським методом, дістають з анкет лише ту інформацію, яка стосується цієї проблеми. Фахівець-прогнозист враховує «за» та «проти» експертів стосовно кожної точки зору. Головний результат функціонування цієї системи полягає в тому, щоб запобігти досягненню групою власних мети й завдань. 3. Статистична характеристика групової відповіді полягає в тому, що група фахівців складає прогноз, який містить точку зору більшості експертів. При цьому використовують статистичні характеристики відповіді, яка відображає думку всієї групи. Групова відповідь може бути подана у вигляді медіани та двох квартилів, тобто таким числом, яке перевищує оцінки однієї половини групи та менше за оцінки другої. Члени журі змінюють свої оцінки за умови переконливих доказів їхніх колег, у противному разі вони дотримуються власних точок зору. Метод має кілька недоліків. 1. На кінцевий результат впливають особисті риси експертів, зокрема наполегливість в обстоюванні своїх думок. 2. Застосування методу може вимагати значних коштів, а кінцевий результат не завжди задовольняє всіх експертів. 3. Немає згоди щодо того, чи варто використовувати саме фахівців. Як розуміти термін «експерт» (чи має журі складатися з фахівців різних спеціальностей) або яким обсягом інформації треба обмінюватися на першому етапі (медіани можуть зумовити зсув до центру розподілу). Сутність методу колективної експертної оцінки для розробки прогнозів полягає у досягненні погодженості думок експертів з перспективних напрямків розвитку об'єкта прогнозування, що сформульовані були раніше окремими фахівцями, а також в оцінці аспектів розвитку об'єкта, яка не може бути визначена іншими методами (наприклад, аналітичним розрахунком, експериментом і т.д.). Зміст методу колективної експертної оцінки полягає в наступному. По-перше, для організації проведення експертних оцінок створюються робочі групи, до функцій яких входить проведення опитування, обробка матеріалів і аналіз результатів колективної експертної оцінки. Робоча група призначає експертів, які дають відповіді на поставлені питання, що стосуються перспектив розвитку даної галузі. Кількість експертів, залучених до розробки прогнозу, може коливатися від 10 до 150 чоловік, у залежності від складності об'єкта. По-друге, перед тим, як організувати опитування експертів, необхідно уточнити основні напрямки розвитку об'єкта, а також скласти матрицю, яка відбиває генеральну мету, підцілі і засоби їх досягнення. Наступний етап колективної експертної оцінки складається з розробки питань, що будуть запропоновані експертам. По-третє, при проведенні опитування експертів необхідно забезпечити однозначність розуміння окремих питань, а також незалежність суджень експертів. По-четверте, ведеться обробка матеріалів колективної експертної оцінки, що характеризують узагальнену думку і ступінь погодженості індивідуальних оцінок експертів. Обробка даних оцінок експертів служить вихідним матеріалом для синтезу прогнозних гіпотез і варіантів розвитку галузі. Остаточна оцінка визначається або як середнє судження, або як середнє арифметичне значення оцінок всіх експертів, або як середнє нормалізоване зважене значення оцінки. Методика статистичної обробки матеріалів колективної експертної оцінки для розробки науково-технічних прогнозів являє собою сукупність оцінок відносної важливості, призначених експертами кожному з оцінюваних напрямків наукових досліджень.   7.3 Організація і проведення експертного опитування Для проведення якісної експертизи необхідні такі умови.  Наявність експертної комісії, яка складається з фахівців, знайомих із об’єктом експертизи, котрі мають досвід експертної роботи.  Існування аналітичної групи, яка професійно володіє технологією організації та проведення експертиз, методами отримання й аналізу експертної інформації.  Отримання надійної експертної інформації.  Коректне оброблення й аналіз експертної інформації. Відокремлюють такі основні етапи експертизи: 1. Формулювання мети експертизи. 2. Побудова об’єктів оцінювання або їхніх характеристик (до початку експертизи цей етап уже може бути виконаний). 3. Відбір експертів та формування експертної групи в залежності від напрямку дослідження. 4. Визначення способу експертного оцінювання та способу подання експертних оцінок (методичне забезпечення розробки;інформаційне забезпечення розробки;кадрове забезпечення дослідження;програмне та технічне забезпечення дослідження). 5. Стимулювання членів експертної групи та проведення експертизи. 6. Оброблення й аналіз результатів експертизи. 7. Повторний тур експертизи, якщо виникає потреба в уточненні або зближенні думок експертів. 8. Формування варіантів рекомендацій. Методичне забезпечення включає, в першу чергу, розробку прогнозних анкет, складання інструкцій по їх заповненню, сукупність моделей та методик, необхідних для розрахунку системи показників, що використовуються в експертних оцінках. В анкетах повинно бути сформульовані питання, що відображають сутність проблеми, і на які повинні дати відповіді експерти. Форма і зміст питань визначаються специфікою об'єкта дослідження. Всю сукупність питань в залежності від їх постановки можна розділити на відкриті та закриті, прямі та непрямі. Дуже суттєве значення при проведенні експертизи має число запитань, що міститься в анкеті. Існує верхня межа кількості питань, яким члени експертної групи зможуть належним чином приділити належну увагу. Це число залежить від типу запитань. На практиці за верхню межу потрібно прийняти 25 питань. В деяких випадках число запитань може бути і більшим. Якщо ж число запитань зросте до 50, то керівник експертизи повинен їх добре вивчити, щоб бути впевненим у тому, що таке число запитань, має рацію і дійсно орієнтовано на рішення важливих проблем та дозволяє сконцентрувати зусилля експертів на рішення поставлених задач або серед запитань є другорядні. Обробка анкет опитування включає обчислення цілого ряду показників, що дозволяють в кінцевому рахунку зробити остаточні узагальнюючі висновки. Серед організаторів експертизи повинні бути спеціалісти, що досконало володіють методикою обробки даних, які містяться в опитувальних анкетах. Організація будь-якого дослідження передбачає створення добре розвинутої інформаційної бази, що складається з нормативно-довідкової та перемінної інформації. Нормативно-довідкова інформація – це словники, коди, класифікатори, різні інструктивні матеріали по формуванню, оформленню, заповненню та обробці анкет. Перемінна інформація – це в першу чергу дані, що містяться в заповнених анкетах. На стадії передпрогнозної орієнтації, що передує вибору та формулюванню задачі колективної експертної оцінки, здійснюється глибокий і всебічний аналіз стану та тенденції розвитку прогнозованого процесу (явища, об’єкта) в країні та за кордоном. Реалізація методу експертних оцінок, як і іншого методу прогнозування, неможлива без відповідного програмного забезпечення та технічних засобів. Технічні засоби – це в першу чергу обчислювальна техніка та засоби зв’язку оргтехніка. Програмні засоби повинні забезпечити формування та зберігання масивів інформації, видачу їх на друкувальні пристрої та ін. Вдале проведення експертизи практично неможливе без стимулювання членів експертної групи – морального та матеріального. Моральне стимулювання включає, наприклад, гарантію для експертів на основі правових норм оформлення пріоритету та авторства на нові ідеї, які висунуті в процесі експертизи, включення в план роботи, співавторство в наукових звітах та ін. Науково обґрунтований прогноз – це цінний товар, на розробку якого витрачається праця високопрофесійних спеціалістів. І як будь-який товар, він не має бути безкоштовним. Ось чому матеріальна зацікавленість експертів – важлива умова добросовісного проведення експертизи. Тим більше, як свідчить досвід, відсутність прогнозу чи поганий прогноз обійдеться споживачам прогнозної інформації дорожче.   7.4 Види експертних оцінок Експертиза, тобто вимірювання та порівняння об’єктів, пов’язана з певним оцінюванням об’єктів. Оцінки бувають різних видів. На відміну від кількісних, які зазвичай відповідають об’єктивним вимірюванням об’єктивних показників, в експертизі використовують бальні оцінки. Вони характеризують суб’єктивні думки. Бальна шкала являє собою обмежений ряд рівновіддалених одне від одного чисел. Бальні оцінки бувають двох видів: 1) оцінки першого виду здійснюють згідно з об’єктивним критерієм, загальноприйнятим еталоном і відповідно до градацій цього еталона. Чим точніше характеристика й оцінка відхилення від еталону, тим більшою є довіра до нього. Отже, оцінювання здійснюють за бальною шкалою; 2) бальну оцінку другого виду застосовують, коли бракує не тільки загальноприйнятих еталонів, а й навіть сумнівною є наявність одного об’єктивного критерію, що забезпечує суб’єктивні відображення у вигляді оцінок. У цьому разі йдеться про порядкову (або рангову) шкалу. Такі оцінки можна порівнювати за принципом «більше-менше». Наступний вид оцінювання — ранжування. Це впорядкування об’єктів за зменшенням віддання переваги (допускається рівноцінність об’єктів та їхніх оцінок). Існує метод попарного порівняння, який іноді здається легшим для якісного порівняння двох об’єктів, ніж оцінювання їх за бальною або ранговою шкалою. Для впорядкування об’єктів на підставі якісного критерію подеколи доцільним є метод середньої точки: обирають кращий і гірший об’єкти; потім об’єкт, який може розташовуватися посередині між ними, потім об’єкти, які можна розташувати посередині між гіршим і раніше знайденим середнім, а також посередині між кращим і середнім, тощо. Для отримання й оброблення кількісними методами якісної експертної інформації використовують вербально-числові шкали зі змістовними найменуваннями певних градацій і відповідними їм числовими значеннями або діапазонами числових значень. Відома вербально-числова шкала Харрінгтона, яка має такий вигляд: Найменування градації Числові інтервали Дуже висока 1,0—0,8 Висока 0,8—0,63 Середня 0,63—0,37 Низька 0,37—0,2 Дуже низька 0,2—0,0 Питання, які є в опитувальних анкетах, можуть бути орієнтовані на оцінку часу та ймовірності настання різних подій, визначення кількісних значень параметрів та показників, оцінку питомої ваги різних варіантів рішень, оцінку відносної важливості параметрів, факторів, напрямків розвитку. При оцінці часу здійснення певної події або визначення кількісних значень показників та параметрів в якості узагальнюючих характеристик даних експертного опитування використовуються мода, медіана, верхній та нижній квартилі. Мода та медіана – це різновиди середніх величин, які називаються умовно структурними середніми. Мода – це величина ознаки, яка найчастіше зустрічається у вибірковій сукупності. Медіана умовно ділить ряд розподілу на дві рівні частини. Мода в інтервальному варіаційному ряді обчислюється за формулою:   (7.1)   де Хмо – мінімальне значення ознаки модального інтервалу (модальним вважається інтервал з найбільшою частотою); імо – розмір модального інтервалу; fмо, fмо-1, fмo+1– відповідно значення частот модального інтервалу, інтервалів, які передують і слідують за модальним. Медіана в інтервальному варіаційному ряді обчислюється за формулою:   (7.2)   де Хме – мінімальне значення медіанного інтервалу (медіанним вважається інтервал, в якому комулятивна сума частот дорівнює або перевищує половину суми частот); іме – розмір медіанного інтервалу; Σf – сума частот (кількість експертів); Sмe-1– сума комулятивних частот в інтервалі, який передує медіанному; fме– частота медіанного інтервалу.   ЛЕКЦІЯ 8 «Визначення кількісних параметрів та аналіз показників експертного опитування» Анотація Оцінка ступеня узгодженості думок. Аналіз результатів опитування експертів. Експертні оцінки і моделі бінарного вибору. Моделі множинного вибору в експертному оцінюванні майбутнього.   8.1 Визначення кількісних параметрів і показників експертного опитування Оцінка ступеня узгодженості думок. Оцінкою відносної важливості напрямків (факторів, параметрів) не обмежується обробка даних опитувальних анкет. Не менш важливі питання для наукового обґрунтування прогнозу мають оцінки відносної важливості, які характеризують: а) узагальнену думку групи експертів стосовно відносної важливості розвитку різних об’єктів; б) рівень узгодженості думок експертів; в) «активність» експертів (міра їхньої участі в оцінюванні різних об’єктів); г) компетентність експертів з кожного із запропонованих питань. Дані експертизи являють собою сукупність оцінок, наданих кожним експертом кожному з оцінюваних ним об’єктів прогнозування. Ці оцінки виражають у балах (наприклад, від 0 до 100). а) В економічному прогнозуванні широке розповсюдження отримала оцінка порівняльної важливості окремих факторів (параметрів, напрямків). Оцінка експертом відносної важливості факторів здійснюється, як правило, шляхом присвоєння деякої кількісної оцінки, наприклад, за 100-бальною системою. Експерт надає кожному фактору (параметру, напрямку) кількість балів в межах від 0 до 100. Нуль присвоюється в тому випадку, якщо фактор, на думку експерта, не має суттєвого значення; 100 балів присвоюється тому фактору, який має найбільш важливе вирішальне значення. Експерт може надати однакову кількість балів декільком факторам, якщо на його думку вони в рівному ступені суттєві. При обробці матеріалів колективної експертної оцінки відносної ваги факторів (параметрів, напрямку) доцільно використовувати метод рангової кореляції. Тому дані оцінені в балах, відповідним чином ранжують по мірі зменшення та отримують оцінки рангів. Порядковий номер, що визначає місце кожного фактора в загальній сукупності факторів, називається рангом. Зазвичай ранги відповідають числам натурального ряду 1, 2, 3, ... , n, де n – кількість ранжованихфакторів. Ранг, рівний одиниці, присвоюється найбільш важливому фактору; ранги із максимальним числом n – найменш важливому фактору. Якщо експерт присвоює однакову кількість балів декільком факторам, то їм присвоюється стандартизовані ранги. Стандартизований ранг – це частка від ділення суми місць, зайнятих факторами з однаковими рангами, на загальну кількість таких альтернатив. При обробці результатів експертних оцінок по відносній важливості напрямків визначається ряд статистичних характеристик, на основі яких оцінюється кожний напрямок (параметр, фактор). Сума рангів, призначених експертами j-ому напрямку досліджень, визначається за формулою: (8.1)   де Rij— ранг наданий i -м експертом об’єкту j. Очевидно, що під час порівняння значущості різних об’єктів найважливішим слід вважати той, що характеризується найбільшим значенням Si. Середній ранг для кожного напрямку дорівнює:   (8.2)   Поряд з середніми рангами для кожного напрямку визначається середня величина в балах: (8.3) При оцінці важливості окремих напрямків представляє інтерес показник частота максимально можливих оцінок, що визначається за формулою:   (8.4)   де m100j— кількість 100-бальних оцінок, наданих j-му об’єкту. Цю величину розраховують для кожного з m напрямів досліджень, вона може коливатися у межах від 0 до 1. Нижня межа відповідає випадку, коли серед оцінок, одержаних j-м напрямом досліджень, немає максимально можливих (100 балів) оцінок, а верхня — випадку, коли всі оцінки, одержані j-м напрямом досліджень, є максимально можливими. Важливість j-гo напрямку збільшується при зміні k100j від 0 до 1. Цей показник слід розглядати як додатковий до основного показника важливості Mj. Він характеризує значущість об’єкта i з точки зору кількості присуджених йому «перших місць». Крім абсолютних величин оцінки важливості напрямку при обробці даних анкет опитування застосовуються також відносні показники. Для цього індивідуальні показники спочатку нормуються, а потім обчислюються середньозважені величини. Нормування – це перехід від абсолютних величин до відносних. Середня вага кожного напрямку (нормована оцінка) розраховується за формулою: (8.5)   Оскільки оцінки, поставлені кожним експертом окремим напрямкам різняться, як правило, значно, доцільно обчислювати розмах, використовуючи для цього залежність: (8.6)   де L – розмах оцінок, в балах, даних j-му напрямку; CjmaxCjmin – відповідно максимальна та мінімальна оцінки, поставлені j-му напрямку окремим експертом. б) Показником рівня узгодженості думок експертів стосовно відносної важливості сукупності всіх запропонованих до оцінювання об’єктів слугує коефіцієнт конкордації . Його визначають для кожного питання на кшталт «оцінка важливості» шляхом обчислення таких показників: — середньої арифметичної сум рангів оцінок, одержаних усіма об’єктами:   (8.7)   де m — кількість об’єктів експертизи, i = 1, 2, …, m; — відхилень dj суми рангів оцінок, одержаних об’єктом jвід середньої арифметичної сум рангів оцінок, одержаних усіма об’єктами:   (8.8)   — показників Тi однакових рангів оцінок, наданих i-м експертом. Якщо всі m рангів оцінок, наданих i-м експертом, різні, то Ti = 0; якщо серед рангів оцінок трапляються однакові, тоді: (8.9)   де Li — кількість груп однакових рангів; nlj — кількість об’єктів, які утворюють l-у групу однакових рангів. Потім обчислюють коефіцієнт конкордації за формулою:   (8.10)   Коефіцієнт конкордації приймає значення від 0 до 1. Чим більше значення коефіцієнта конкордації, тим вище ступінь узгодженості думок експертів. При Ккон = 1 є повна узгодженість думок експертів; якщо К = 0, то узгодженість практично відсутня. Якщо значення коефіцієнта конкордації Ккон невелике, спостерігається незначна узгодженість поглядів експертів. Причини тут можуть бути різні: або в досліджуваній сукупності експертів справді немає спільності поглядів, або серед сукупності експертів існують групи з великою узгодженістю поглядів, однак їхні узагальнені думки протилежні. Статистична істотність (довірча імовірність) коефіцієнта Ккон перевіряється за критерієм Пірсона χ2з (n – 1) ступенями свободи:   (8.11)   Розраховане значення співставляється з табличним значенням для n-1 ступенів свободи та довірчої ймовірності (Р = 0,95або Р = 0,99). Якщо факт > табл., то коефіцієнт конкордації істотний, якщо навпаки то необхідно збільшити кількість експертів. Рівень узгодженості поглядів кожного експерта з рештою експертів унаочнює багатокутник, кожна вершина якого відповідає певному експерту, а лінії, що з’єднують певну вершину з іншими, — коефіцієнтам парної рангової кореляції. Ступінь збігу думок двох експертів визначається за допомогою коефіцієнта парної рангової кореляції між оцінками двох будь-яких експертів α і βта інформаційної міри збігу думок (Устюжанінова). Коефіцієнт парної рангової кореляції між оцінками двох будь-яких експертів α і β визначають за формулою: , (8.12) де — різниця (за модулем) величин рангів оцінок j-го напряму досліджень, заданою експертами а і β, ; Ta, Tβ — показники однакових рангів оцінок експертів а і β. Коефіцієнт парної рангової кореляції може набувати значення – 1 ≤ ρ ≤ +l. Значення ρ = + 1 відповідає цілковитій узгодженості поглядів двох експертів. Значення ρ= – 1 показує, що думка одного експерта є протилежною погляду іншого. Інформаційна міра збігу думок (Устюжанінова) обчислюється за формулою:   , (8.13)   де Eαβ – міра збігу думок експертів α і β; nαβ – кількість напрямків (факторів, параметрів), однаково оцінених експертами αі β (по балам); nα, nβ – кількість факторів, оцінених відповідно експертом α та експертом β (якщо напрямок оцінено в 0 балів, то в кількість оцінених воно не включається). Багатокутник також дає змогу визначити групи експертів, усередині яких узгодженість поглядів велика, тоді як між групами існує неузгодженість. Чим нижчий рівень статистичної значущості показника узгодженості поглядів експертів, тим більшою є імовірність існування невипадкової узгодженості поглядів експертів. Розкид думок експертів, рівень якого по суті відображає узгодженість думок, оцінюється, окрім коефіцієнта конкордації, за допомогою інших статистичних показників, в тому числі: 1) дисперсія оцінок, даних j-му напрямку:   (8.14) 2) коефіцієнт варіації оцінок, даних j-ому напрямку:   , (8.15) . 3) загальна дисперсія оцінок:   , (8.16) де ;   4) загальна дисперсія рангів:   , (8.17) де     в) Показник активності експертів kаеi визначають таким чином:   , (8.18)   де kаеi– коефіцієнт активності експертів по j-му напрямку; mj– кількість експертів, що оцінили j-й напрямок; m – загальна кількість експертів. Чим більше kаеi, тим більша кількість експертів вважають себе компетентними в оцінюванні i-го напряму досліджень. г)Аналіз компетентності, як правило, здійснюють за допомогою спеціальних анкет. У відповідях на них кандидати в експерти мають продемонструвати свої ділові і фахові якості, а також аналітичні здібності. Для визначення відповідності потенційного експерта названим вимогам використовують анкетне опитування. Додатково ще вдаються до самооцінювання компетентності експерта. Коли експерт визначає міру своєї обізнаності з досліджуваного питання. Оброблення даних дає можливість одержати кількісну оцінку компетентності потенційного експерта за такою формулою: ,   , (8.19)   де vj — вага показника, закресленого експертом стосовно j-ї характеристики в анкеті у балах; vjmax — максимальна вага (межа шкали) j-ої характеристики в балах; n — загальна кількість характеристик компетентності в анкеті; λ— вага клітинки, закресленої експертом у шкалі самооцінки в балах; р — межа шкали самооцінки експерта в балах. Показником компетентності експерта може слугувати такий коефіцієнт:   , (8.20)   де kk — коефіцієнт компетентності експерта; kз — коефіцієнт міри ознайомлення експерта з обговорюваною проблемою. Він визначається шляхом самооцінки експерта за десятибальною шкалою. Значення балів для самооцінки: 0 — експерт не розуміється на питанні; 1, 2, 3 — експерт мало розуміється на питанні, але воно належить до кола його інтересів; 4, 5, 6 — експерт задовільно розуміється на питанні, але не бере безпосередньої участі в практичному розв’язанні його; 7, 8, 9 — експерт добре розуміється на питанні, бере участь у практичному розв’язанні його; 10 — питання належить до кола вузької спеціалізації експерта. Експерту пропонують самому оцінити міру обізнаності з питанням і підкреслити відповідний бал, який потім помножують на 0,1 і отримують коефіцієнт kз; ka — коефіцієнт аргументації, який розраховують як суму балів еталонної таблиці. У цій таблиці експерт оцінює джерело інформації за градаціями: В (висока), С (середня), Н (низька). Приклад 8.1. Трьом експертам треба визначити рейтинг п’яти об’єктів інвестування. Кожен експерт оцінює міру привабливості інвестицій за балами від одного до п’яти. Оцінки експертів наведено в таблиці 8.1.   Таблиця 8.1 – Оцінки експертів Потрібно встановити, чи є в наведених результатах певний порядок стосовно відносної привабливості сукупності запропонованих до оцінювання об’єктів інвестування і якщо є, тоді визначити їхні реальні рейтинги. Розв’язок.Підрахуємо суму квадратів відхилень di2 та коефіцієнт конкордації .   ; . Оскільки значенню di2= 76 відповідає рівень значущості а, що перебуває у межах (0,0053; 0,015), гіпотезу про неузгодженість думок експертів відхиляють з імовірністю похибки, яка не перевищує 0,015. Остаточно розташувати об’єкти за їхньою інвестиційною привабливістю можна, наприклад, за сумами номерів Si. Так, напрямок А має посісти друге місце, напрямок Б слід поставити на третє, напрямок В — на перше місце, потім йдуть напрямки Г та Д.   8.2 Аналіз результатів опитування експертів Завершальним етапом експертної оцінки є аналіз результатів опитування, які служать інформаційним та рекомендаційним матеріалом для прийняття управлінських рішень. Аналізу повинні підлягати не лише система статистичних оцінок, але й весь хід проведення експертизи: визначення цілей, підбір експертів, складання опитувальних анкет, організація проведення опитування. Всі етапи експертизи повинні бути ретельно проаналізовані, щоб виявити всі негативні моменти і виключити їх в майбутньому. Система статистичних характеристик, отриманих за результатами обробки статистичних анкет – це лише сукупність показників, «сировина», що потребує вмілого та професіонального осмислення, оцінки, тлумачення, від яких, в кінцевому результаті, залежить успіх та практична цінність всієї експертизи. Методика проведення аналізу результатів опитування експертів залежить, по-перше, від виду експертизи – індивідуальної чи колективної, а по-друге, від напрямку експертизи – визначення часу здійснення певної події, оцінка очікуваних в майбутньому величин параметрів об'єктів (процесів, явищ); оцінка відносної важливості фактора (напрямку); оцінка питомої ваги різних видів рішень та ін. Враховуючи певну обмеженість індивідуальних експертних оцінок, їх результати необхідно порівнювати з існуючими поглядами на досліджувану проблему та результатами прогнозних оцінок інших спеціалістів. За результатами експертизи слід провести якісну оцінку кожного члена експертної групи. При цьому слід звернути увагу не тільки на визнання та популярність окремих спеціалістів, а і від їх відношення до справи: точності, добросовісності, акуратності, творчого підходу, переконаності в своїй правоті, що може бути аргументована. Необхідно дотримуватися досить важливого правила: жоден із спеціалістів не повинен бути виключений з експертної групи за формальними правилами (наприклад, за показниками узгодженості думок) без зваженого аналізу суті питання. Історія науки та техніки неодноразово ілюструє факти, що, на перший погляд, парадоксальні ідеї та висновки містять в собі нові фундаментальні відкриття. Багато експертів являються, як правило, видатними спеціалістами тільки в своїй області. Тому їх висновки слід розглядати в більш широкому контексті, наприклад, з перспективами розвитку економіки підприємства (регіону, країни). Іншими словами, висновки експертів слід пов'язувати із зовнішніми факторами, що визначають майбутнє прогнозованого об'єкта. Не слід забувати, що існує своя «цехова» зацікавленість експертів, свої інтереси, які не завжди збігаються із загальними інтересами. В зв'язку з цим висновки експертів повинні бути детально перевірені, осмислені та творчо використані.     8.3 Експертні оцінки і моделі бінарного вибору Уявлення про лінійну взаємодію – швидше абстракція, що допомагає спростити задачу, зробивши її завжди вирішуваною, але з деякою помилкою, якою можна нехтувати. Логіка отримання результатів по такій схемі оцінювання без урахування сумісних ефектів цілком з'ясовна. Рішення шукається для конкретної ситуації з фіксованою структурою показників, яка хоча і не указується в завданні експерту, але, як правило, присутня в його уявленнях про вирішувану задачу. Але як тільки структура починає змінюватися, зразу ж з'являються невраховані ефекти взаємодії і надійність експертних оцінок різко знижується. Тому безпосереднє оцінювання показників з передбачуваною лінійною структурою взаємозв'язків необхідно замінити складнішою, заснованою на модельному представленні структурою, але без ускладнення самої процедури опиту експертів. При цьому модель, що відображає взаємозв'язок між можливістю появи події, що цікавить нас, і набором оцінюваних показників, повинна бути, ймовірно, нелінійної і, крім того, економетричною, оскільки інтерес викликають не тільки механізм взаємодії, але і кількісна оцінка сили цієї взаємодії, а також бажання замінити повторні експертні опити прогнозними оцінками. Останнє особливо важливе. Саме цією можливістю не володіють раніше розглянуті методи. Таким чином, значення висловлюваного тут підходу в тому, щоб експертну інформацію використовувати для побудови моделі, а не для отримання самих оцінок. Виникає природне питання: «Яким чином експертна інформація може використовуватися для цих цілей?» Видно, можна запропонувати декілька підходів, що забезпечують реалізацію обговорюваної тут ідеї. Наша пропозиція полягає в тому, щоб інтуїцію і знання експертів застосувати для формування спеціального набору даних псевдовибірки, по якій оцінюються коефіцієнти моделі, що має відмінність від безпосередніх експертних оцінок, багатопланове застосування: аналіз, оцінка значущості чинників, прогноз очікуваних подій і т.п. Природно, це значно розширює область практичного використовування експертних рішень. Реалізація даного підходу припускає введення бінарної змінної з наступним значенням:   Вважатимемо, що значення цієї змінної, що характеризує появу події, що цікавить нас, залежить від оцінюваного нами набору показників х1, х2, ..., хm, і існує безліч різних варіантів х1, х2, ..., хn цих наборів хi = (xi1, xi2,…, xim), відмінних один від одного всіма або деякими своїми компонентами (оцінюваними показниками). Передбачається, що у кожного експерта є уявлення про те, при реалізації яких варіантів очікувана подія матиме місце, а при реалізації яких – немає. Математично це припущення записується у вигляді залежності:   ,   де yik – очікуване значення бінарної залежної змінної, яке k-й експерт пов’язує з і-м набором оцінюваних показників; f(xi1, xi2,…, xim) – індексна функція, тобто функція, що приймає всього два значення: 0 і 1; εik– помилка, яку може допустити k-й експерт, що оцінює вплив і-го набору на появу очікуваної події (εik– випадкова змінна із значеннями в номінальній шкалі: 1, 0, -1). Тепер стає зрозумілою реалізація заснованої на модельному підході ідеї отримання експертних рішень. Спочатку в результаті цільового опиту експертів формується псевдовибірка, об'єднуюча в собі суб'єктивні думки з приводу закономірностей, що цікавлять нас, переваг, рейтингів, прогнозних оцінок і т.п. Потім за даними псевдовибірки будується регресійна залежність, що пов'язує суб'єктивні думки з одночасним їх усереднюванням в єдину формалізовану залежність. Побудована таким чином модель, по суті, є концентрованим виразом узагальненої думки експертів по проблемі, що вивчається, і може використовуватися для аналізу і отримання всіляких оцінок. Модель як результат опиту, а не разові експертні оцінки є головною особливістю даного підходу. Завдяки цій особливості вдається одержати прогнозні оцінки експертних думок, тобто оцінки суб'єктивного характеру щодо тих подій або об'єктів, про яких експерти не знали або не мали уявлення у момент формування псевдовибірки. Практична реалізація цієї процедури вимагає розгляду цілого ряду досить складних питань: Як побудувати регресію на бінарну змінну? Якими способами експерти повинні формувати вибіркову сукупність (псевдовибірку) для побудови регресії з бінарною залежною змінною? Як оцінити компетентність експерта і адекватність побудованої таким чином моделі? Як перевірити узгодженість думок опитуваної групи експертів? Як оцінити надійність розрахункових характеристик, одержуваних за допомогою регресії суб'єктивних думок? Яку змістовну інтерпретацію мають оцінки, одержані в результаті моделювання експертних переваг? Чи можна, а якщо можна, то як використовувати статистичні методи для перевірки різного роду гіпотез, що висуваються щодо оцінюваних параметрів і об'єктів? По суті, в цих питаннях немає нічого нового. Практично всі вони в тому або іншому ступені присутні в задачах прямого експертного оцінювання, забезпечуючи надійність одержуваних результатів. Але розрахунок і аналіз характеристик, а також відповідні висновки на їх основі в новому підході відрізняються від того, як це робиться в традиційному, тому вимагають спеціального розгляду.   8.4 Моделі множинного вибору в експертному оцінюванні майбутнього Розглянемо випадок, коли перед експертами стоїть задача вибору не серед двох, а серед цілої безлічі альтернативних варіантів. За наслідками їх вибору, оформленим у вигляді псевдовибірки, вимагається побудувати модель, за допомогою якої можна буде здійснювати прогнозні розрахунки експертних переваг у вигляді відповідної вірогідності. Для вирішення цієї задачі можна скористатися мультіноміальноюлогіт-моделью, яка по суті є узагальненням логіт-моделібінарного вибору. Нижче достатньо детально описується мультіноміальналогіт-модельі деякі деталі, що характеризують особливість її побудови і аналізу. Вірогідність настання того або іншого варіанту описується поліноміальною логіт-моделю .   Вектор незалежних змінних х = [zj, wj] складений з двох підвекторів, кожний з яких має власне смислове навантаження. Компоненти вектора z; прийнято називати атрибутами і розуміти їх як показники, по яких розрізняються альтернативи. У свою чергу, компоненти вектора wіназивають характеристиками. Оцінка параметрів моделі не даєоднозначного результату, оскільки разом з обчисленими коефіцієнтами bідентична вірогідність дозволяє одержати вектор b + d. Уникнути цієї неоднозначності дозволяє операція нормалізації (стандартизації), значення якої в тому, щоб для одного з варіантів покласти bj = 0. Тоді оцінюється не J + 1 функція, а Jфункцій одного вигляду   ,   після чого визначається ще одна функція через значення цих функцій шляхом віднімання їх суми з одиниці:     Це одна з особливостей побудови поліноміальної логіт-моделі. Оцінювання коефіцієнтів моделі здійснюється шляхом чисельного рішення рівнянь правдоподібності. Для запису самого рівняння правдоподібності, а точніше його логарифмічної форми, зручно ввести змінну dij, яка приймає значення 1, якщо в i-м спостереженні (i-м індивідуумом) був вибраний j-й альтернативний варіант серед (J + 1)-го, і 0 – інакше. Тоді для кожного і тільки одне з dij буде рівне 1. Використовуючи введену змінну dij, запишемо функцію логарифмічної правдоподібності .   Диференціюючи цей вираз по bj, одержимо систему рівнянь максимальної правдоподібності       У одержаному виразі 1(j = l) приймає значення 1 при j = l і 0 – інакше. Це дозволяє здійснювати селекцію, оскільки результатом твору РЛ(j = l) є Р., Коефіцієнти моделі важко інтерпретуються. Нелінійний характер не дозволяє безпосередньо через коефіцієнти прослідити зв'язок між рівнем вірогідності і атрибутами (чинниками). Тому природно для цих цілей використовувати граничний аналіз. Диференціюючи по l-му атрибуту в i-й точціj-ю вірогідність, одержуємо граничний ефект у вигляді       ЛЕКЦІЯ 9 «Критерії визначення якісного прогнозу» Анотація Поняття оптимального прогнозу. Оцінювання адекватності прогнозованої моделі. Критерії визначення якісного прогнозу. Оцінка точності прогнозованої моделі та прогнозів.   9.1. Поняття оптимального прогнозу Оптимальний прогноз — це зроблене на підставі економічної теорії передбачення, яке використовує всю доступну на момент побудови прогнозу інформацію. Для оптимального прогнозу граничний виграш та граничні витрати збігаються. Оптимальний прогноз іще називають прогнозом раціональних сподівань. Раціональні сподівання можуть відрізнятися від фактичних значень, але будь-яка різниця має бути випадковою й непередбачуваною. Оскільки раціональні сподівання ґрунтуються на коректній економічній теорії, вони мають властивості незсуненості (за умови квадратичної функції витрат) та ефективності. Незсуненість означає, що помилка прогнозу має нульове математичне сподівання. Ефективність передбачає, що в процесі прогнозування буде використана вся доступна інформація, отже, помилка прогнозу не буде корелювати з цією інформацією. Існують численні критерії перевірки раціональності послідовності прогнозів. Стандартний критерій незсуненості потребує перевірки гіпотези стосовно того, що α= 0 та β = 1 водночас для такої моделі:   , (9.1) де yt — ряд фактичних значень або спостережень; — ряд прогнозованих значень; — випадкові залишки. Перевірка ефективності є складнішою оскільки неможливо коректно визначити відповідний масив інформації, стосовно якого похибки прогнозу будуть некорельованими. Узагальнюючи огляд критеріїв визначення якісного прогнозу, можна стверджувати, що варто користуватися системою критеріїв, які мають враховувати: ü кількість зусиль, витрачених на побудову моделі, і наявність готових комп’ютерних програм; ü швидкість, із якою метод уловлює істотні зміни у поведінці ряду, наприклад раптовий зсув математичного сподівання або збільшення кута нахилу лінії тренду; ü існування серійної кореляції у помилках; ü незмінюваність первинних даних; ü повний обсяг роботи в деяких сферах діяльності — тисячі рядів щомісяця потребують оновлення, невеликі витрати й швидкість мають першорядне значення; терміновість прогнозування.   9.2. Оцінювання адекватності прогнозованої моделі. Незалежно від виду і способу побудови економіко-математичної моделі питання про можливість її застосування з метою аналізу і прогнозу економічного явища може бути вирішено тільки після встановлення адекватності моделі. Оскільки повної відповідності моделі реальному процесу або об’єкту бути не може, адекватність певною мірою умовне поняття. При моделюванні мається на увазі адекватність не взагалі, а тим властивостям моделі, які вважаються суттєвими для дослідження. Модель згладжування певного часового ряду вважається адекватною, якщо правильно відображає систематичні компоненти часового ряду. Ця вимога еквівалентна вимозі, щоб залишкова компонента (t = 1, 2, ..., n) відповідала таким властивостям випадкової компоненти часового ряду як: випадковість коливань рівнів залишкової послідовності, відповідність розподілу випадкової компоненти нормальному закону, рівність математичного сподівання випадкової компоненти нулю, незалежність значень рівнів випадкової компоненти. Розглянемо, яким чином здійснюється перевірка цих властивостей залишкової послідовності. Перевірка випадковості коливань рівнів залишкової послідовності означає перевірку гіпотези про правильність вибору виду тренду. Для дослідження випадковості відхилень від тренду розраховують набір різниць (t = 1, 2, ..., n). Характер цих відхилень вивчається за допомогою ряду непараметричних критеріїв. Одним з таких критеріїв є «критерій серій», який використовує медіану вибірки, критерій «зростаючих» та «спадних» серій тощо. Згідно з критерієм серій ряд із величин розташовують у порядку зростання їхніх значень і знаходять медіану одержаного варіаційного ряду, тобто значення, що перебуває в середині для непарного п або середню арифметичну з двох середніх значень для п парного. Повертаючись до вхідної послідовності і порівнюючи значення цієї послідовності з , ставлять знак «плюс», якщо значення , перевищує медіану, і знак «мінус», якщо воно менше за медіану; у випадку однаковості порівнюваних величин відповідне значення пропускають. Отже, одержують послідовність, що складається із плюсів та мінусів, загальна кількість яких не перевищує п. Послідовність розташованих одне за одним плюсів або мінусів називають серією. Щоб послідовність була випадковою вибіркою, довжина найдовшої серії не має бути занадто великою, а загальна кількість серій – занадто малою. Позначимо довжину найдовшої серії через Кmax, а загальну кількість серій – через v. Вибірка вважається випадковою, якщо виконуються такі нерівності для 5 %-го рівня значущості:   , (9.2) ,   де квадратні дужки означають цілу частину числа. Якщо хоча б принаймні одна з цих нерівностей порушується, то гіпотеза про випадковий характер відхилень рівнів часового ряду від тренду спростовується, а модель тренду визнається неадекватною. Перевірка відповідності розподілу випадкової компоненти нормальному закону розподілу може бути зроблена лише наближено за допомогою дослідження показників асиметрії (А) і ексцесу (Е), оскільки часові ряди, як правило, не дуже довгі. При нормальному розподілі показники асиметрії і ексцесу певної генеральної сукупності дорівнюють нулю. Припустимо, що відхилення від тренду являють собою вибірку з генеральної сукупності, тому можна визначити тільки вибіркові характеристики асиметрії й ексцесу та їхні помилки: ; ; (9.3) ; , (9.4)   де – вибіркова характеристика асиметрії; – вибіркова характеристика ексцесу; і – відповідні середньоквадратичні помилки. Якщо одночасно виконуються такі нерівності:   ; ,   то гіпотеза про нормальний характер розподілу випадкової компоненти приймається. Якщо виконується хоча б одна з цих нерівностей:   ; ,   то гіпотеза про нормальний характер розподілу відхиляється, трендова модель визнається неадекватною. Інші випадки потребують додаткової перевірки за допомогою складніших критеріїв. Для адекватних моделей доцільно ставити запитання щодо оцінювання їхньої точності. Вважається, що моделі з меншою розбіжністю між фактичними й розрахунковими значеннями краще відображають досліджуваний процес у майбутньому. Для характеристики рівня близькості використовують такі описові статистики: середнє квадратичне відхилення (або дисперсія)   ; (9.5)   середню відносну похибку апроксимації (чим ближче до 0, тим точніша модель): ; (9.6)   коефіцієнт сходження: , (9.7)   коефіцієнт детермінації (чим ближче до 1, тим точніша модель):   . (9.8)   У формулах (9.5—9.8) n — кількість рівнів ряду, k — кількість пояснювальних змінних у моделі, — оцінки рівнів ряду за моделлю, — середнє арифметичне значення вибірки. На підставі розглянутих показників можна з кількох адекватних моделей обрати найточнішу. Помилка прогнозу, обчисленого для періоду, характеристики котрого вже були використані при оцінюванні параметрів моделі, як правило, буде незначною та мало залежатиме від теоретичної обґрунтованості, застосованої для побудови моделі. Оскільки формально-статистичний вибір кращої моделі в багатьох випадках не гарантує цілковитої впевненості в його правильності, адже добрий прогноз можна отримати і на підставі поганої моделі, і навпаки, тому про якість застосовуваних методик і моделей у прогнозуванні можна судити лише за сукупністю зіставлень прогнозів і їх реалізації. При цьому незалежно від обраної методики та моделі прогнозування джерелами помилок прогнозу можуть бути: 1) природа змінних (випадковий характер змінних гарантує, що прогноз відхилятиметься від справжніх величин, навіть якщо модель правильно специфікована, її параметри точно відомі); 2) природа моделі (сам процес оцінювання спричиняє похибки оцінок параметрів); 3) помилки, привнесені прогнозом незалежних випадкових величин (пояснювальних змінних); 4) помилки специфікації моделі. Перевірка рівності математичного сподівання випадкової компоненти нулю, якщо вона розподілена за нормальним законом, виконується на основі t-критерію Стьюдента. Розрахункове значення цього критерію задається формулою   , (9.9)   де – середнє арифметичне значення рівнів залишкової послідовності ; – стандартне (середньоквадратичне) відхилення для цієї послідовності. Якщо розрахункове значення t менше табличного значення tα статистики Стьюдента із заданим рівнем значущості α і числом ступенів свободи п – 1, то гіпотеза про рівність нулю математичного сподівання випадкової послідовності приймається, в протилежному випадку ця гіпотеза відхиляється і модель вважається неадекватною. Перевірка незалежності значень рівнів випадкової компоненти, тобто перевірка відсутності суттєвої автокореляції в залишковій послідовності, може здійснюватися за рядом критеріїв, найбільш поширеним з яких є DW-критерій Дарбіна-Уотсона. Зазначимо, що розрахункове значення критерію Дарбіна-Уотсона в інтервалі від 2 до 4 свідчать про від’ємний зв’язок. У цьому випадку його треба перетворити за формулою DW' = 4 – DW і далі використовувати значення DW'. Висновок про адекватність трендової моделі робиться, якщо всі розглянуті вище чотири перевірки властивостей залишкової послідовності дають позитивний результат. 9.3. Критерії визначення якісного прогнозу Якість прогнозу характеризують такі поширені в прогностичній літературі терміни, як точність і надійність. Проте зміст цих термінів часто тлумачать досить неоднозначно. Це можна пояснити тим, що нині поки не знайдено ефективного підходу до оцінювання якості прогнозу, окрім його практичного підтвердження. Про точність прогнозу прийнято судити за розміром помилки прогнозу — різниці між прогнозовим і фактичним значенням досліджуваного показника. Але такий підхід можливий лише тоді, якщо дослідник має інформацію стосовно справжніх значень часового ряду, який він оцінював під час розроблення прогнозів. Наприклад, період випередження вже завершився, і дослідник має фактичні значення змінної (це можливо в разі короткотермінового прогнозування) або прогноз перебуває в стадії розроблення, тобто прогнозування здійснюється для певного моменту часу в минулому, для якого існують фактичні дані. Спрощену схему періодів прогнозування показано на рис. 9.1.     Рис. 9.1 – Спрощена схема періодів прогнозування   В останньому випадку йдеться про використання expost-прогнозу. Його сутність полягає у побудові моделі за меншим обсягом даних (n - m) із подальшим порівнянням прогнозовихоцінок за останніми m точками (для t від n - m + 1 до n) із відомими фактичними, але спеціально залишеними рівнями ряду. Отримані ретроспективно помилки прогнозу певною мірою характеризують точність застосовуваної методики прогнозування й можуть виявитися корисними в зіставленні кількох прогнозів. Розмір помилки ретроспективного прогнозу не можна розглядати як остаточний доказ придатності, або навпаки, непридатності застосовуваного методу прогнозування. До неї варто ставитися з відомою обережністю і при її застосуванні в якості міри точності необхідно враховувати, що вона отримана при використанні лише частини наявних даних. Проте ця міра точності має більшу наочність і теоретично більш надійна, ніж похибка прогнозу, обчислена для періоду характеристики котрого вже були використані при оцінюванні параметрів моделі. На основі розглянутих показників можна зробити вибір з декількох адекватних моделей найбільш точної. Помилка прогнозу, обчислена для періоду, характеристики котрого вже були використані при оцінюванні параметрів моделі, як правило, будуть незначними і мало залежатимуть від теоретичної обґрунтованості, застосованої для побудови моделі. Оскільки формально-статистичний вибір кращої моделі у багатьох випадках не дає повної впевненості у його правильності: гарний прогноз може бути отриманий і по поганій моделі, і навпаки, то, про якість прогнозів застосовуваних методик і моделей можна судити лише по сукупності зіставлень прогнозів і їхньої реалізації. При цьому незалежно від обраної методики моделі прогнозування джерелами помилок прогнозу можуть бути: 1) природа змінних (випадковий характер змінних гарантує, що прогноз буде відхилятися від справжніх величин, навіть якщо модель правильно специфікована та її параметри точно відомі); 2) природа моделі (сам процес оцінювання спричиняє похибки оцінок параметрів); 3) помилки, що вносяться прогнозом незалежних випадкових величин (пояснюючих змінних); 4) помилки специфікації моделі.   9.4. Оцінка точності прогнозної моделі та прогнозів Параметричні методи аналізу точності прогнозів. За результатами ex post-прогнозу розраховують такі показники точності прогнозів за m кроків: Середня квадратична похибка:   , (9.10)   корінь із середньоквадратичної похибки   , (9.11)   середня абсолютна похибка:   , (9.12)   корінь із середньоквадратичної похибки у відсотках:   , (9.13)   середня абсолютна похибка у відсотках (МАРЕ):   , (9.14)   Чим менше значення цих величин, тим вища якість ретропрогнозу. На практиці ці характеристики використовують досить часто. Даний підхід дає гарні результати, якщо на періоді ретропрогнозу не виникають принципово нові закономірності. На підставі останніх двох критеріїв можна дійти висновку стосовно загального рівня адекватності моделі шляхом їх порівняння. Цей рівень наведений у таблиці 9.1   Таблиця 9.1 – Точність пронозу в залежності від MAPE, RMSE
MAPE, RMSE Точність прогнозу
Менше 10% Висока
10% - 20% Добра
20% - 40% Задовільна
40% - 50% Погана
Більше 50% Незадовільна

 

Вадою обговорених вище характеристик точності прогнозів є їх залежність від обраних одиниць виміру. Було б корисним указати безрозмірний показник, аналогічний до коефіцієнта кореляції. Одним з таких показників є коефіцієнт невідповідності Тейла, чисельником якого є середньоквадратична похибка прогнозу, а знаменник дорівнює квадратному кореню із середнього квадрата фактичних та оцінних значень:

 

, (9.15)

 

Перевага коефіцієнта Тейла полягає в тому, що його значення завжди перебувають у межах від нуля до одиниці. Якщо всі прогнози абсолютно точні, то U = 0. Якщо всі прогнози дорівнюють нулю, а жодне з фактичних значень не дорівнює нулю або навпаки, U дорівнюватиме одиниці. Таким чином, мале значення U засвідчує, що прогноз є точним, але максимального значення не існує. Значення, яке дорівнює одиниці, відповідає ситуації, коли всі прогнозові значення дорівнюють нулю, що нереально під час прогнозування номінальних величин, але під час розгляду змін такий прогноз відповідає моделі «без змін». Більші за одиницю значення вказують на те, що прогноз гірший, ніж прогноз «без змін».

Коефіцієнт невідповідності Тейла (U) може бути розкладений на три частини:

пропорцію зсунення , (9.16)

 

пропорцію дисперсії , (9.17)

 

пропорцію коваріації , (9.18)

 

Зазначимо, що UM + US + UC = 1. Критерій зсуву пропорції (UM) використовується, щоб перевірити, чи є систематичне відхилення середніх розрахованих та фактичних рядів, тобто чи дає модель систематично завищені або занижені прогнози. Чим менше значення, тим краще. Якщо UM дорівнює нулю, у розрахованих (прогнозних) значеннях немає зсунень, тобто з моделлю все гаразд. Пропорція дисперсії (US) використовується, щоб переконатися, що модель має достатні динамічні властивості для відтворення дисперсії фактичних рядів. Наприклад, модель може відтворювати систематично менші коливання, ніж фактичні. Як і у випадку критерію UM, менше значення US вказує на менше зсунення. Пропорція коваріації вказує, як корелюють фактичні та розраховані ряди. Якщо UC дорівнює 1, то фактичні та розраховані ряди корелюють ідеально.

Критичні точки важливі як критерії якості, оскільки деякі моделі можуть бути точними, але погано передбачати зміни тенденції (наприклад, поворотні точки в циклах), тобто погано відтворювати критичні точки. Інші моделі можуть бути неточними, але мати гарний динамічний характер. Загалом може бути певний компроміс між точністю та динамічними властивостями моделі. Формального тесту для оцінки цієї властивості не існує. Проте візуальний огляд розрахованих та фактичних рядів звичайно одразу виявляє, здатна модель відтворювати критичні точки чи ні.

Обговорені характеристики точності прогнозів є параметричними в тому сенсі, що вони потребують виконання заданих припущень щодо властивостей математичного сподівання та дисперсії, чинних за умов нормальності відповідних розподілів. Наприклад, використовуючи MSE, ми неявно припускаємо, що всі похибки прогнозу мають однакові й постійні математичні сподівання та дисперсії. У реальних економічних ситуаціях найчастіше порушуються припущення гомоскедастичності та відсутності автокореляції. Можна стверджувати, що кожного разу прогноз будується у новій ситуації, отже, порівняння числової точності прогнозів, зроблених у різні моменти часу, не зовсім коректне. Наведені міркування зумовили використання непараметричних методів аналізу точності прогнозів.

Непараметричні методи аналізу точності прогнозів.

Непараметричні методи не залежать від вигляду розподілу, тож не потребують припущення щодо нормальності розподілів. Це особливо корисно, коли йдеться про дані, які унеможливлюють використання числових шкал. Розглянемо два типи непараметричних критеріїв: критерій знаків та рангові критерії.

Критерій знаків для порівняння точності двох послідовностей прогнозів базується на відсотку випадків, коли метод визначення прогнозу А кращий, ніж метод В. Таке порівняння здійснюють для індивідуальних прогнозів однакових подій (змінних). Якщо обидва методи дають однакову точність, імовірність відповіді «так» на запитання «чи прогноз А кращий за прогноз В» становить 0,5 для кожного з т випадків прогнозування. Число К випадків, коли прогноз А кращий, підпорядковано біноміальному розподілу ймовірностей

 

, (9.20)

 

Отже, можна підрахувати імовірність того, що К ≥ х. Якщо довжина послідовності прогнозів значна, для оцінювання ймовірностей можна використати нормальну апроксимацію біноміального розподілу.

Критерій знаків можна також використовувати для перевірки значущості описової статистики, відомої під назвою «відсоток кращих результатів», яка показує відсоток випадків, у яких один метод прогнозування кращий за інший і розраховується за формулою:

 

, (9.21)

 

де m — кількість прогнозів, підтверджених фактичними даними;

n — кількість прогнозів, не підтверджених фактичними даними.

Коли всі прогнози підтверджуються, n = 0 і η = 1; якщо всі прогнози не підтвердилися, то m, а отже, і η дорівнюють 0.

Рангові критерії. У разі застосування цих критеріїв чисельна характеристика точності (абсолютна похибка, коли маємо один прогноз, або MSE, коли розглядають послідовність прогнозів) замінюється рангами, які потім перевіряють на значущість. Наприклад, якщо послідовності прогнозів показників А та В одержують за допомогою k методів, то спочатку обчислюють MSE, потім їхні значення ранжують від 1 (найменша MSE) до k (найбільша MSE) (відповідні ранги позначають через RA, та RB, для i = 1, …, k). Після знаходження різниць (dі) між рангами обчислюють коефіцієнт рангової кореляції Спірмена:

, (9.23)

 

За нульову гіпотезу приймають відсутність залежності між рангами, тобто жоден з методів не є гіршим за решту. Гіпотеза відкидається, якщо значення rs досить велике.

Хоча непараметричні методи мають свої переваги, важливо усвідомлювати, що вони ігнорують частину доступної інформації. Так, критерії знаків та рангів не враховують числових значень похибок.


ЛЕКЦІЯ 10 «Побудова комбінованого прогнозу»

Анотація

Інтегровані критерії точності й адекватності. Поняття комбінованого прогнозу. Алгоритм об’єднання окремих прогнозів. Методи об’єднання прогнозів: дисперсійно-коваріаційний, регресійний.

 

10.1 Інтегровані критерії точності й адекватності.

Схема формування інтегрованих критеріїв точності й адекватності, а також загального критерію якості прогнозування полягає у тому, що формується склад окремих критеріїв, на підставі яких обчислюють інтегрований показник (скажімо, точність можна характеризувати лише коефіцієнтом детермінації, або дисперсією та середньою помилкою апроксимації, або всіма переліченими критеріями).

Попередньо для кожного окремого критерію розробляють процедуру його нормування. Нормований критерій одержують із вихідної статистики критерію таким чином, щоб виконувалися умови: нормований критерій дорівнює 100, якщо модель абсолютно точна (адекватна), нормований критерій дорівнює 0, якщо модель абсолютно неточна (неадекватна).

Узагальнений критерій якості моделі розраховують як зважену суму узагальненого критерію точності (його вага 0,75) і узагальненого критерію адекватності (його вага 0,25), тобто віддають перевагу точності. За характеристику точності обирають нормоване значення середньої відносної похибки апроксимації, а за критерій адекватності — нормоване значення критерію Дарбіна-Ватсона та характеристики нормального закону розподілу залишкової компоненти. Числове значення узагальненого критерія якості перебуває у діапазоні від 0 до 100 (мінімум відповідає абсолютно неправильній моделі, а максимум — моделі, що ідеально відображає розвиток показника). Досвід застосування цього показника свідчить про надійність моделей, оцінка якості яких не менша за 75.

Наведені вимірювання якості прогнозу виходять із незначного відхилення його від фактичних значень, але зрозуміло, що деякі змінні прогнозувати простіше, ніж інші. Так, вважається, що обсяг поточного рахунка платіжного балансу, який визначається як різниця двох великомасштабних показників — імпорту та експорту, — прогнозувати важче, ніж величини, які змінюються відносно повільно, наприклад тривалість життя, рівень безробіття. Отже, для визначення оптимального прогнозу необхідний системний критерій. Точніше оптимальний прогноз слід визначати з розгляду функції витрат користувача прогнозу, тобто з аналізу збитків через помилку прогнозу, а також із порівняння додаткового виграшу від зменшення помилки та витрат на вдосконалення прогнозу. Таким чином, оптимальним вважається найкращий прогноз, який можна одержати за наявних обставин.

Узагальнюючи огляд критеріїв визначення якісного прогнозу, можна зробити висновок, що потрібно користуватися системою критеріїв, які повинні враховувати:

- кількість зусиль, що витрачаються на побудову моделі і наявність готових комп’ютерних програм;

- швидкість, із якою метод уловлює істотні зміни у поведінці ряду, наприклад, раптовий зсув математичного сподівання або збільшення кута нахилу лінії тренду;

- існування серійної кореляції у помилках;

- незмінюваність первинних даних;

- повний обсяг роботи у деяких сферах діяльності – тисячі рядів щомісяця потребують оновлення, невеликі витрати і швидкість мають першорядне значення;

- терміновість прогнозування.

 

10.2. Поняття комбінованого прогнозу

Серед дослідників немає єдиної думки щодо існування найкращого методу прогнозування. Досвід застосування різноманітних підходів до прогнозування доводить, що кожен метод призводить до різних результатів. Отже, як правило, виходить кілька відмінних прогнозів одного економічного показника. Постає питання: чи переважає якийсь метод решту, і чи можливо якимось чином скомбінувати прогнози, одержані різними методами, щоб побудувати узагальнений прогноз, який буде точніший за індивідуальні?

Можна сподіватися, що будь-який прогноз, відкинутий через його неоптимальність, майже завжди містить певну корисну незалежну інформацію. Така інформація може бути двосторонньою: по-перше, кожен прогноз ґрунтований на інформації, яка є спеціальною для цього підходу, і тому не враховується в інших методах; по-друге, кожен прогноз відтворює певну форму взаємозв’язків між змінними, що відрізняється від зв’язків, досліджуваних в інших моделях. Об’єднання незалежно одержаних прогнозів залучає обидва види додаткової інформації, і якщо припустити, що кожна з моделей описує лише один бік динаміки заданого процесу, то використання кількох моделей уможливить точніший і повніший опис і прогнозування динаміки. Не випадково сучасна теорія систем пропонує стратифікований підхід до опису складних систем. Така точка зору сприяла ідеї об’єднання прогнозів і формування на цій основі комбінованого, або об’єднаного прогнозу.

Об’єднання можна здійснювати як на підставі прогнозів, отриманих із різних джерел, наприклад, експертним шляхом і за допомогою моделей, так і із застосуванням, побудованими за допомогою статистичних моделей одного класу.

Спосіб об’єднання окремих прогнозів, як правило, полягає в тому, щоб представити комбінований прогноз у вигляді зваженої суми окремих прогнозів:

 

, (10.1)

 

де yit— і-й окремий прогноз, одержаний для моменту часу t;

М — кількість об’єднуваних прогнозів;

ki — вагові коефіцієнти окремих прогнозів. 0 ≤ k ≤1.

Сума всіх вагових коефіцієнтів має давати одиницю, кремі ваги мають перебувати в інтервалі [0, 1]. Очевидно, що головна проблема, яка при цьому виникає, — визначення ваг ki, оскільки саме вони визначатимуть якість об’єднаного прогнозу. На практиці завжди прагнуть надати більшої ваги тому набору прогнозів, який містить менші за величиною середньоквадратичні похибки. Існує чимало способів визначення вагових коефіцієнтів, найвідомішими серед яких є два:

- дисперсійно-коваріаційний метод, що дає змогу зводити кілька незміщених прогнозів у лінійну комбінацію з найменшою дисперсією. Вагові коефіцієнти окремих прогнозів залежать від дисперсій та коваріацій похибок прогнозів;

- регресійний метод, який є узагальненням дисперсійно-коваріаційного на випадок зсуненості прогнозів.

Розглянемо метод, при якому вагові коефіцієнти визначаються з умови мінімуму дисперсії помилок узагальненого прогнозу (максимуму його точності), яка знаходиться як сума всіх елементів коваріаційної матриці помилок окремих прогнозів із відповідними вагами.

 

10.3. Алгоритм об’єднання прогнозів

Алгоритм об’єднання окремих прогнозів має такі кроки:

1. Обчислюються дисперсії помилок окремих прогнозів і будується коваріаційна матриця:

, j = 1 ,…, M, (10.2)

де ej – помилки окремих прогнозів;

t – порядковий номер спостереження, t = 1 ,…, n;

.

 

2. Будуються матриця В і вектор С за формулами:

 

; (10.3)

. (10.4)

3. Через розв’язання системи лінійних рівнянь одержують (М – 1) значення рj, при цьому значеневий коефіцієнт рМ визначається як:

 

. (10.5)

 

4. Перевіряється умова: pj > 0, j = 1 ,..., М.

При цьому:

а) якщо умова не виконується, прогнози виключаються і перераховуються вагові коефіцієнти (із поверненням до п. 2);

б) якщо всі вагові коефіцієнти додатні, то розраховується значення узагальнюючого прогнозу F і коефіцієнт умовної ефективності

 

; , (10.6)

 

де – дисперсія помилок комплексного прогнозу;

– дисперсія помилок найкращого окремого прогнозу.

5. Оскільки в більшості випадків точність прогнозів змінюється в часі, формули оцінки вагових коефіцієнтів модифікуються так, щоб пізнішим помилкам надати більшого значення. Отже, шляхом зміни вагових коефіцієнтів у бік найкращого окремого прогнозу Fjt коригується узагальнений прогноз:

 

, (10.7)

 

де pjt – вагові коефіцієнти окремих прогнозів у момент часу t;

Fjt – окремий прогноз у момент часу t;

Ft – узагальнений прогноз у момент часу t.

Для підвищення стабільності динаміки зміни ваги в алгоритмі її коригування можна використовувати схему експоненційного згладжування.

У цілому для проведення узагальнення необхідно мати не менше двох адекватних моделей, а для підвищення стійкості результатів кількість узагальнюваних окремих прогнозів не повинна перевищувати п’яти.

Спосіб комбінування прогнозів, одержаних за статистичними моделями одного класу, породжує низку питань. Наприклад, які прогнози можуть об’єднуватися, якою має бути кількість прогнозів та процедура об’єднання тощо. Об’єднання прогнозів пов’язано з такими ускладненнями, як корельованість прогнозів, одержаних за різними моделями, властивість похибок прогнозу змінюватися із часом, зміщення комбінованого прогнозу тощо.Кожне з названих ускладнень потребує застосування спеціального підходу. Поки не розроблено єдиних правил, суб’єктивні судження дослідника є складовою прийняття рішення стосовно того, як комбінувати прогнози.

10.4. Методи об’єднання прогнозів

Дисперсійно-коваріаційний метод. Об’єднання прогнозів розглянемо на прикладі побудови середньозваженого прогнозу двох окремих прогнозів, оскільки поширення одержаних результатів на більшу кількість окремих прогнозів здійснюється досить просто. У загальному випадку два незсунені прогнози можна скомбінувати для одержання нового прогнозу. Будемо виходити з мінімізації дисперсії похибки прогнозу, тобто використовувати квадратичну функцію збитків.

Нехай маємо на період t два незсунені прогнози і , дисперсії яких та і коваріація . Новий незсунений прогноз будується за правилом

 

. (10.8)

 

Дисперсія похибки комбінованого прогнозу дорівнюватиме:

 

. (10.9)

 

Мінімізуючи цей вираз за k , одержимо, що

 

. (10.10)

 

Отже, ваги в оптимальній лінійній комбінації залежать від дисперсій та коваріацій похибок прогнозу, звідки й походить назва дисперсійно-коваріаційний метод.

Кореляція між похибками окремих прогнозів дорівнює , підстановка замість та k у (10.23) дає

 

. (10.11)

 

Звідси можна показати, що ( ) ≥ 0 та ( ) ≥ 0 і менше або дорівнює мінімальному з та . Отже, комбінований прогноз принаймні не менш точний за кращий із двох прогнозів, які взято як компоненти.

Оптимальну величину k не можна одержати на початковій стадії синтезу прогнозу, оскільки вона змінюється мірою накопичування знань про відносну ефективність двох окремих прогнозів. Більше того, на попередній стадії ще невідомі ані дисперсії похибок окремих прогнозів , ані коефіцієнти кореляції між цими похибками. Їх треба оцінювати. Узагальнення цього методу до комбінування M прогнозів відбувається за формулою:

 

, (10.12)

 

де V — коваріаційна матриця похибок прогнозу розмірності M × M;

I — M-мірний вектор-стовпчик, усі координати якого є одиницями.

Аналіз знайдених оптимальних ваг дає підстави для таких висновків:

ü по-перше, очевидно, що інтуїтивна привабливість простого вибору найкращого (із найменшою дисперсією похибки) прогнозу та його використання здається сумнівною, оскільки в загальному випадку комбінований прогноз має меншу дисперсію похибки;

ü по-друге, якщо та дорівнюють один одному, то у ваги також рівні, а комбінований прогноз є простим середнім значенням компонентів.

ü по-третє, якщо коваріація похибок прогнозів додатна й більша за одну із дисперсій (наприклад, якщо від’ємне), одна вага буде від’ємною, а інша перевищуватиме одиницю. Зауважимо, що від’ємність ваги не обов’язково свідчить про хибність прогрнозу;

ü по-четверте, коли дисперсія похибки прогнозу прямує до нуля, вага цього прогнозу прямує до одиниці. Отже, чим надійніший прогноз, тим більшу вагу він має.

Регресійний метод є узагальненням дисперсійно-коваріаційного методу. Його можна тлумачити як оцінювання параметрів регресійного рівняння виду

, (10.13)

 

де збурення v має нульове середнє.

Новий комбінований прогноз є лінійною комбінацією М прогнозів. Коефіцієнти βi, i = 0, 2, ..., M оцінюють за методом найменших квадратів. Якщо всі прогнози є незсуненими, то доданок β0 можна опустити. У цьому разі значення коефіцієнтів збігатимуться із оцінками вектора Z із попереднього методу.