Економетрична модель, що будується на основі системи рівнянь, крім регресійних функцій, може включати тотожності.
Незалежні змінні моделі називаються пояснюючими, наперед заданими змінними. Залежні змінні називаються пояснюваними змінними.
Побудова будь-якої економетричної моделі, незалежно від того, на якому рівні і для яких показників вона будується, здійснюється як послідовність певних кроків.
Крок 1. Знайомство з економічною теорією, висунення гіпотези взаємозв'язку. Чітка постановка задачі.
Крок 2. Специфікація моделі. Використовуючи всі ті форми функцій, які можуть бути застосовані для вивчення взаємозв'язків, необхідно сформулювати теоретичні уявлення і прийняті гіпотези у вигляді математичних рівнянь. Ці рівняння встановлюють зв'язки між основними визначальними змінними за припущення, що всі інші змінні є випадковими.
Крок 3. Формування масивів вхідної інформації згідно з метою та завданнями дослідження.
Крок 4. Оцінка параметрів економетричної моделі методом найменших квадратів. Аналіз залишків дає змогу відповісти на запитання: чи не суперечить специфікація моделі передумовам «класичної» моделі лінійної регресії?
Крок 5. Якщо деякі передумови моделі не виконуються, то для продовження аналізу треба замінювати специфікацію або застосовувати інші методи оцінювання параметрів.
Крок 6. Проведення аналізу достовірності моделі та прогнозу за побудованою моделлю.
|
Рис.1. Етапи побудови моделі
Економетрична модель базується на єдності двох аспектів — теоретичного, якісного аналізу взаємозв'язків та емпіричної інформації. Теоретична інформація знаходить своє відображення в специфікації моделі.
Специфікація моделі — це аналітична форма економетричної моделі На основі досліджуваних чинників вона складається з певного виду функції чи функцій, що використовуються для побудови моделей, має ймовірнісні характеристики, які притаманні стохастичним залишкам моделі.
Лінійні функції найпоширеніші в економетричному моделюванні, тому обґрунтування економетричних методів розглянемо на базі лінійних моделей.
Вибір аналітичної форми економетричної моделі не може розглядатися без конкретного переліку незалежних змінних, тому специфікація моделі передбачає відбір чинників для економетричного дослідження.
При цьому в процесі такого дослідження можна кілька разів повертатись до етапу специфікації моделі, уточнюючи перелік незалежних змінних та вид функції, що застосовується. Адже, коли вид функції та її складові не відповідають реальним процесам, то йдеться про помилки специфікації.
Помилки специфікації моделі можуть бути трьох видів:
1) ігнорування при побудові економетричної моделі істотної пояснюючої змінної;
2) введення в модель незалежної змінної, яка не є істотною для
вимірюваного зв'язку;
3) використання невідповідних математичних форм залежності.
Першаз цих помилокпризводить до зміщення оцінок, причому
зміщення буде тим більшим, чим більша кореляція між введеними та невведеними до моделі змінними, а напрям зміщення залежить від знака оцінок параметрів при введених змінних і від характеру кореляції між введеними та не введеними змінними. Оцінки параметрів також будуть зміщеними (у такому разі вони вищі), тому застосування способів перевірки їх значущості може спричинитися до хибних висновків щодо значень параметрів генеральної сукупності.
Для відшукання цього джерела помилок специфікації досить важко запропонувати які-небудь загальні міркування, оскільки незалежна змінна, що не враховується (або незалежні змінні), може бути одним із багатьох можливих пояснень. Про необхідність введення до моделі цих незалежних змінних можна лише здогадуватись на підставі апріорних міркувань. Проте відомі й більш формалізовані процедури, які дають змогу з'ясувати, наскільки істотним є введення до моделі якої-небудь змінної. Так, якщо побудувати економетричну модель на базі покрокової регресії (метод покрокової регресії розглянемо пізніше), то можна досить чітко ранжувати пояснювальні змінні за величиною їх впливу на залежну змінну. Про відсутність основної змінної свідчить зміна поводження випадкового відхилення у помилково специфікованій моделі.
Друга помилка специфікації.У цьому разі, якщо до моделі вводиться змінна, яка неістотно впливає на залежну змінну, то (на відміну від першої помилки специфікації) оцінки параметрів моделі будуть незміщеними. Причому за допомогою звичайних процедур можна одержати також незміщені оцінки дисперсій цих параметрів. Але це не означає, що економетричну модель можна беззастережно розширювати за рахунок «неістотних» змінних. По-перше, існує не-нульова ймовірність того, що в результаті використання вибіркових даних змінна, яка зовсім не стосується моделі, покаже істотний зв'язок із залежною змінною. А це означає, що кількісний зв'язок між змінними буде виміряний неправильно.
Третя помилка специфікації.Припускається, що залежна змінна є лінійною функцією від деякої пояснювальної змінної, тоді як насправді тут краще підійшла б квадратична, кубічна чи якась полі-номіальна залежність вищого порядку. У цьому разі наслідки такі самі, як і при першій помилці специфікації, тобто оцінки параметрів моделі матимуть зміщення.
Питання про вибір найкращої форми залежності має базуватися на перевірці ступеня узгодженості виду функції з вхідними даними спостережень.
Адекватність побудованої моделі можна встановити, аналізуючи залишки моделі. Вони обчислюються як різниці між фактичними значеннями залежної змінної та обчисленими за моделлю. Щоб перевірити, чи має розподіл залишків невипадковий характер, можна скористатися критерієм Дарбіна—Уотсона. Тоді перевірка моделі на існування автокореляції першого порядку аналогічна перевірці того, наскільки вдало вибрано форму економетричної моделі.
Нехай економетрична модель у матричній формі має вигляд:
Y = ХА + и, (1)
де Y — вектор значень залежної змінної; X — матриця незалежних змінних розміром п на т (п — число спостережень, т — кількість незалежних змінних); А — вектор параметрів моделі; и — вектор залишків.
Застосовуємо 1МНК для оцінки параметрів моделі, якщо виконуються такі умови:
1) математичне сподівання залишків дорівнює нулю, тобто
М(u) = 0; (2)
2) значення щ вектора залишків и незалежні між собою і мають постійну дисперсію, тобто
M(uu') = Е, (3)
де Е — одинична матриця;
3) незалежні змінні моделі не пов'язані із залишками:
М(х'u) = 0; (4)
4) незалежні змінні моделі утворюють лінійно незалежну систе
му векторів, або, іншими словами, незалежні змінні не повинні бути мультиколінеарними, тобто |Х' Х| ≠0 . Це означає, що матриця X має повний ранг.
Перша умова є очевидною. Адже коли математичне сподівання залишків не дорівнює нулю, то це означає, що існує систематичний вплив на залежну змінну, а до модельної специфікації не введено всіх основних незалежних змінних. Якщо ця передумова не виконується, то йдеться про помилку специфікації.
Друга умовапередбачає наявність сталої дисперсії залишків. Цю властивість називають гомоскедастичністю. Проте вона може виконуватись лише тоді, коли залишки и є помилками вимірювання. Якщо залишки акумулюють загальний вплив змінних, які не враховані в моделі, то звичайно дисперсія залишків не може бути сталою величиною, вона змінюється для окремих груп спостережень. У такому разі йдеться про явище гетероскедастичності, яке впливає на методи оцінювання параметрів.
Третя умовапередбачає незалежність між залишками і пояснювальними змінними, яка порушується насамперед тоді, коли еконо-метрична модель будується на базі одночасових структурних рівнянь або має лагові змінні. Тоді для оцінювання параметрів моделі використовуються, як правило, дво- або трикроковий методи найменших квадратів.
Четверта умоваозначає, що всі пояснювальні змінні, які входять до економетричної моделі, мають бути незалежними між собою. Проте очевидно, що в економіці дуже важко вирізнити такий масив незалежних (пояснювальних) змінних, які були б зовсім не пов'язані між собою. Тоді щоразу необхідно з'ясовувати, чи не впливатиме залежність пояснювальних змінних на оцінку параметрів моделі.
Це явище називають мультиколінеарністю змінних, що призводить до ненадійності оцінки параметрів моделі, робить їх чутливими до вибраної специфікації моделі та до конкретного набору даних. Знижується рівень довіри до результатів верифікації моделей за допомогою 1МНК.
Оцінимо методом 1МНК параметри моделі (1), для якої виконуються умови (2)—(5).
Рівняння (1) подамо у вигляді: и = Y-XA. Тоді суму квадратів залишків и можна записати так:
. (5)
Продиференціюємо цю умову за А і прирівняємо похідні до нуля:
.
Або
X' ХА =Х'Y, (6)
де X' — матриця, транспонована до матриці незалежних змінних X.
Звідси
А = (Х'Х)-1Х'Y . (7)
Рівняння (6) дає матричну форму запису системи нормальних рівнянь, а формула (7) показує, що вектор А є розв'язком системи таких рівнянь.
Формули (6) і (7) можна одержати й інакше.
Так, помноживши рівняння (1) зліва спочатку на X', а потім на матрицю (X' X)-1, одержимо:
.
Оскільки (X' X) -1 X' X = Е, то справджується рівність:
Згідно з (4), коли п —> ∞, М (X' u) = 0, отже, .Неважко показати, що оцінки , обчислені за (7), мінімізують суму квадратів залишків и.
При цьому значення вектора є розв'язком так званої системи нормальних рівнянь (Х'Х) =Х'Y.Якщо незалежні змінні в матриці X взяті як відхилення кожного значення від свого середнього, то матрицю X' X називають матрицею моментів.
У цьому випадку числа, що розміщені на її головній діагоналі, характеризують величину дисперсій незалежних змінних, інші елементи відповідають взаємним коваріаціям.
Отже, структура матриці моментів відображає зв'язки між незалежними змінними. Чим ближчі показники коваріацій до величини дисперсій, тим ближчий визначник матриці X' X до нуля і тим гірші оцінки параметрів . Далі буде показано, що стандартні помилки параметрів прямо пропорційні до значень, розміщених на головній діагоналі матриці (X' X)-1.
Розглянемо приклад оцінювання параметрів моделі 1МНК.
Приклад 1. Оцінити параметри економетричної моделі, що характеризує залежність між тижневими витратами на харчування, загальними витратами та розміром сім'ї. Вихідні дані в умовних одиницях наведені в табл. 1.
1.Вихідні дані
з/п | Витрати на харчування Су), ум. од. | Загальні витрати (х), ум. од. | Розмір сім'ї (х2), кількість. Членів |
1,5 | |||
1,6 | |||
1,9 | |||
1,8 | |||
3,4 | |||
3,6 | |||
3,4 | |||
3,5 | |||
5,5 | |||
5,4 | |||
5,4 | |||
5,3 | |||
8,5 | |||
8,3 | |||
8,1 | |||
7,3 |
Розв'язання
Запишемо економетричну модель:
де — відповідно фактичні та розрахункові значення тижневих витрат на харчування за моделлю; x1 — загальні витрати; x2 — розмір сім'ї; и — залишки; — оцінка параметрів моделі.
Оператор оцінювання параметрів моделі за 1МНК має вигляд :
А = (Х'Х)-1Х'У,
де
X' — матриця, транспонована до матриці X.
Матриця X, крім двох векторів незалежних змінних, містить вектор одиниць. Він дописується в цій матриці ліворуч тоді, коли економетрична модель має вільний член. Не дописуючи такого вектора одиниць, вільний член можна обчислити, скориставшись рівністю:
, де — середнє значення залежної змінної; , — середні значення незалежних змінних х1, і х2 .
Згідно з оператором оцінювання знайдемо:
1)(Х'Х) = 16 416,2 74,5
16,2 1601562 23271,2
74,5 23271,2 436,69
2) 0,314 - 0,00017 -0,0446
-0,00017 0,00003 -0,00012
-0,0446 -0,00012 0,0165
Отже, економетрична модель має вигляд: .
Знайдені методом 1МНК оцінки параметрів такі:
; ; , тобто
Отже, коли за всіх однакових умов незалежна змінна х1, (загальні витрати) збільшується (зменшується) на одиницю, то залежна змінна у (оцінка витрат на харчування) також збільшується (зменшується) на 0,2004 одиниць. Якщо за інших незміннних умов незалежна змінна х2 (розмір сім'ї) збільшується (зменшується) на одиницю, то залежна змінна у (оцінка витрат на харчування) також збільшується (зменшується) на 6,9306 одиниць.
У класичній регресійній моделі У = ХА + u; вектор и = (u1, u2 ,...,un) і залежний від нього вектор У = (у1, у2,…, yn)' є випадковими змінними. До оператора оцінювання входить вектор У = ( = (Х ’Х)-1 Х'У),а, отже, оператор також можна вважати випадковою функцією оцінювання параметрів моделі.
Відомо, що для характеристики випадкових змінних , поряд з математичним сподіванням, застосовуються також дисперсія і коваріація . Істинні (справжні) значення цих параметрів класичної економетричної моделі утворюють дисперсійно-коваріа-ційну матрицю:
Оцінки коваріаційної матриці
використовуються для знаходження стандартних помилок та обчислення довірчих інтервалів оцінок параметрів . Вони використовуються й при перевірці їх статистичної значущості.
На головній діагоналі матриці містяться оцінки дисперсій j- оі оцінки параметрів, що ж до елементів , які розміщені поза головною діагоналлю, то вони є оцінками коваріації між і .
Отже,
де – оцінка дисперсії залишків;
.
Оскільки вектор залишків , то добуток векторів можна записати так:
Звідси маємо альтернативну форму запису дисперсії залишків:
.
Позначимо (j, k)-й елемент матриці (X' X)-1 символом сjk, тоді j-й елемент по головній діагоналі матриці обчислюється за формулою:
. (8)
Коваріації , що містяться за межами головної діагоналі, відповідно такі:
. (9)
Приклад2. Для економетричної моделі обчислимо коваріаційну матрицю . Отже, маємо:
;
n=16, m= 3
Розв 'язання
1. Обчислимо незміщену оцінку дисперсії залишків :
.
Визначимо дисперсії оцінок :
3. Обчислимо коваріації відповідних оцінок параметрів:
Знак «мінус» перед оцінками коваріацій указує на те, що збільшення однієї оцінки параметрів приводить до зменшення в середньому іншої і навпаки.
Отже, одержимо дисперсійно-коваріаційну матрицю
(10)
4. Запишемо стандартні помилки оцінок параметрів моделі:
Порівняємо кожну стандартну помилку з відповідним числовим значенням оцінки параметра, тобто знайдемо відношення (11) :
Отже, стандартні помилки оцінок параметрів щодо рівня оцінок параметрів становлять відповідно 41 %, 18 % і 12 %, а це свідчить про зміщеність оцінок.
Використаємо модель (1) для знаходження прогнозних значень вектора Уо, який відповідатиме очікуваним значенням матриці незалежних змінних Х0.. Наш прогноз може бути точковим або інтервальним. Інтервальний прогноз побудуємо на основі точкового, скориставшись побудованою економетричною моделлю.
Щоб отримати інтервальний прогноз, необхідно розрахувати середню похибку прогнозу.
Вона зростає з віддаленням значення від відповідного середнього значення вибірки.
Розрахуємо спочатку дисперсію прогнозу.
У матричному вигляді дисперсія прогнозу
; (12)
(13)
Довірчий інтервал для прогнозних значень
(14)
де — критичне значення t-критерію при п - т ступенях вільності і рівні значущості α.
Зауважимо, що можна розглядати як точкову оцінку математичного сподівання прогнозного значення , а також як індивідуальне значення для вектора незалежних змінних Хо, що лежить за межами базового періоду.
Для визначення інтервального прогнозу індивідуального значення необхідно знайти відповідну стандартну похибку :
Отже, інтервальний прогноз індивідуального значення визначається як
(15)
. Необхідно розрахувати для економетричної моделі точковий та інтервальний прогнози індивідуального значення залежної змінної, коли для прогнозного періоду відомий вектор
.
1. Визначаємо точкові прогнозні значення залежної змінної,
: то .
Визначаємо дисперсію прогнозу за формулою :
Стандартна помилка прогнозу :
Табличне значення критерію Стьюдента при рівні значущості α= 0,05 і ступенів вільності п - т = 13 дорівнює t0,05 = 2,160.
Обчислюємо дисперсію і стандартну помилку прогнозу індивідуального значення у0:
.
Стандартна помилка прогнозу індивідуального значення у0 така:
.
Визначаємо інтервальний прогноз індивідуального значення у0:
.
150,894 - 2,160 ▪ 18,5698 ≤ у0 ≤ 150,894 + 2,160 ▪ 18,5698;
150,894 - 40,111 ≤ у0 ≤ 150,894 + 40,111;
110,783≤ у0≤ 191,005.
Отже, з імовірністю р = 0,95 (α = 0,05) прогноз індивідуального значення у0 потрапляє в інтервал [110,783; 191,005].
Можна також зазначити, що з імовірністю p = 0,95 знайдені прогнози покривають М(у0) і у0 ,коли взяти досить велику кількість вибірок і для кожної з них обчислювати інтервальні прогнози.
Економічна інтерпретація: якщо в прогнозному періоді загальні витрати мають рівень 500 одиниць, а сім'я складається з шести осіб, то витрати на харчування потрапляють в інтервал :
110,783≤ у0≤ 191,005.