Контрольная работа: Экономико-математические методы

 

В базе данных магазина, торгующего подержанными автомобилями, содержится информация об их потребительских свойствах и ценах.

Для анализа зависимости цены автомобиля Y от его возраста X1 и мощности двигателя X2 из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице 1.

Таблица 1

Номер автомобиля i

Цена (тыс.у.е.) yi

Возраст (лет) xi1

Мощность двигателя (л.с.) xi2

1 6,8 6,0 93
2 7,2 4,0 67
3 4,3 6,0 57
4 10,0 4,0 106
5 9,7 5,0 108
6 12,4 4,0 136
7 12,9 4,0 143
8 6,6 7,0 127
9 11,2 3,0 93
10 11,2 4,0 111
11 8,3 6,0 124
12 5,6 6,0 81
13 5,6 6,0 71
14 6,4 6,0 88
15 5,3 7,0 112
16 4,0 7,0 88

2. Множественная зависимость

С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надежностью 0,9.

Методом наименьших квадратов найти оценки коэффициентов множественной линейной регрессионной модели


.

Проверить статистическую значимость параметров и уравнения множественной регрессии с надежностью 0,9.

Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей возраста 3 года и мощностью двигателя 165 л.с. с доверительной вероятностью 0,95.

3. Экономическая интерпретация

На основе полученных статистических характеристик провести содержательный экономический анализ зависимости цены автомобиля от его возраста и мощности двигателя.

Расчетная таблица:

y

X1

x2

x12

x22

y*x1

y*x2

y2

x1x2

1 6,8 6 93 36 8649 40,8 632,4 46,2 558
2 7,2 4 67 16 4489 28,8 482,4 51,8 268
3 4,3 6 57 36 3249 25,8 245,1 18,5 342
4 10,0 4 106 16 11236 40,0 1060,0 100,0 424
5 9,7 5 108 25 11664 48,5 1047,6 94,1 540
6 12,4 4 136 16 18496 49,6 1686,4 153,8 544
7 12,9 4 143 16 20449 51,6 1844,7 166,4 572
8 6,6 7 127 49 16129 46,2 838,2 43,6 889
9 11,2 3 93 9 8649 33,6 1041,6 125,4 279
10 11,2 4 111 16 12321 44,8 1243,2 125,4 444
11 8,3 6 124 36 15376 49,8 1029,2 68,9 744
12 5,6 6 81 36 6561 33,6 453,6 31,4 486
13 5,6 6 71 36 5041 33,6 397,6 31,4 426
14 6,4 6 88 36 7744 38,4 563,2 41,0 528
15 5,3 7 112 49 12544 37,1 593,6 28,1 784
16 4,0 7 88 49 7744 28,0 352,0 16,0 616
Сумма 127,5 85 1605 477 170341 630,2 13510,8 1141,9 8444

Коэффициенты парной корреляции:

 =  = -0,833

 = = 0,665

Проверка значимости:

(по таблице).

 = 5,63 > 1,761

 = 3,33 > 1,761

Коэффициенты корреляции существенно отличаются от 0.

Найдем матрицы:

 =

 =

Найдем матрицу , обратную к матрице . Определитель


|XTX| = 16 * 477 * 170341 + 85 * 8444 * 1605 + 1605 * 85 * 8444 – 1605 * 477 * 1605 – 85 * 85 * 170341 – 16 * 8444 * 8444 = 3692086

Алгебраические дополнения:

D11 = (–1)1 + 1  = 477 * 170341 – 84442 = 9951521 и т.д.

Матрица алгебраических дополнений

 =

Присоединенная матрица

(XTX)* = DT =  = D

(матрица D симметрична).

(XTX)–1 = (XTX)* / |XTX| =  =

Вектор оценок коэффициентов модели:

A = (XTX)-1 (XTY) =  =


Y = 10,455 – 1,650x1 + 0,063x2

Расчетная таблица:

y

x1

x2

y -

(y - )2

y -

(y - )2

1 6,8 6,0 93,0 6,38 0,42 0,179 -1,2 1,4
2 7,2 4,0 67,0 8,05 -0,85 0,721 -0,8 0,6
3 4,3 6,0 57,0 4,12 0,18 0,031 -3,7 13,5
4 10,0 4,0 106,0 10,49 -0,49 0,241 2,0 4,1
5 9,7 5,0 108,0 8,97 0,73 0,539 1,7 3,0
6 12,4 4,0 136,0 12,37 0,03 0,001 4,4 19,6
7 12,9 4,0 143,0 12,81 0,09 0,009 4,9 24,3
8 6,6 7,0 127,0 6,86 -0,26 0,065 -1,4 1,9
9 11,2 3,0 93,0 11,33 -0,13 0,016 3,2 10,4
10 11,2 4,0 111,0 10,80 0,40 0,157 3,2 10,4
11 8,3 6,0 124,0 8,32 -0,02 0,000 0,3 0,1
12 5,6 6,0 81,0 5,63 -0,03 0,001 -2,4 5,6
13 5,6 6,0 71,0 5,00 0,60 0,361 -2,4 5,6
14 6,4 6,0 88,0 6,06 0,34 0,113 -1,6 2,5
15 5,3 7,0 112,0 5,92 -0,62 0,379 -2,7 7,1
16 4,0 7,0 88,0 4,41 -0,41 0,171 -4,0 15,8

Сумма

127,5 2,985 125,9

Остаточная дисперсия

S2 = ∑ (yi - i)2 / (n – m – 1) = 2,985 / (16 – 2 – 1) = 0,230

Ковариационная матрица:

S2 (XTX)-1 = 0,230 *  =

Стандартные ошибки коэффициентов равны квадратным корням из диагональных элементов ковариационной матрицы:

S0 =  = 0,787

S1 =  = 0,096

S2 =  = 0,005

Проверим значимость параметров регрессии.

Табличное значение

t1 – α/2, n – 3 = 1,77

t0 = |a0| / S0 = 10,455 / 0,787 = 13,3 > 1,77

t1 = |a1| / S1 = 1,650 / 0,096 = 17,1 > 1,77

t2 = |a2| / S2 = 0,063 / 0,005 = 12,4 > 1,77

Все параметры значимы.

Коэффициент детерминации

 = 1 – 2,985 / 125,9 = 0,976

Табличное значение критерия Фишера

Fт = 3,8

Расчетное значение

Fф =  =  = 267,7 > 3,8

Уравнение значимо.

Точечный прогноз:

(xp) = 10,455 – 1,650 * 3 + 0,063 * 165 = 15,83 тыс. у.е.

Интервальный прогноз


Квантиль распределения Стьюдента (по таблице)

 = t0,975; 13 = 2,16

где S =  =  = 0,479

xp (XTX)-1(xp)T =  =   = 0,633

 = 0,479 *  = 0,381

В,Н = 15,83 ± 2,16 * 0,381 = 15,83 ± 0,68

Н = 15,15

В = 16,51

3. Экономическая интерпретация. Между возрастом автомобиля и его ценой существует тесная отрицательная связь (коэффициент корреляции –0,833): при увеличении возраста на 1 год (при фиксированной мощности двигателя) цена падает в среднем на 1,650 тыс. усл. ед.

Между мощностью двигателя и ценой автомобиля существует менее тесная положительная связь (коэффициент корреляции 0,665): при увеличении мощности на 1 л.с. (при фиксированном возрасте автомобиля) цена увеличивается в среднем на 0,063 тыс. усл. ед.

С вероятностью 0,95 можно утверждать, что цена автомобиля при возрасте 3 года и мощности двигателя 165 л.с. будет находиться в пределах от 15,15 до 16,51 тыс. усл. ед.


Задача 3

 

1. Для регрессионной модели

 и

с помощью критерия Дарбина-Уотсона проверить наличие или отсутствие автокорреляции на уровне значимости 0,05.

2. Для регрессионной модели

проверить наличие или отсутствие мультиколлинеарности, используя:

а) парный коэффициент корреляции;

б) критерий «хи-квадрат» χ2 на уровне значимости 0,05.

Расчетная таблица:

et

et-1

et - et-1

(et - et-1)2

(et)2

2 -0,85 0,42 -1,27 1,62 0,72
3 0,18 -0,85 1,03 1,05 0,03
4 -0,49 0,18 -0,67 0,45 0,24
5 0,73 -0,49 1,22 1,50 0,54
6 0,03 0,73 -0,70 0,49 0,00
7 0,09 0,03 0,06 0,00 0,01
8 -0,26 0,09 -0,35 0,12 0,07
9 -0,13 -0,26 0,13 0,02 0,02
10 0,40 -0,13 0,52 0,27 0,16
11 -0,02 0,40 -0,41 0,17 0,00
12 -0,03 -0,02 -0,01 0,00 0,00
13 0,60 -0,03 0,63 0,39 0,36
14 0,34 0,60 -0,26 0,07 0,11
15 -0,62 0,34 -0,95 0,91 0,38
16 -0,41 -0,62 0,20 0,04 0,17
Сумма 7,11 2,81

Статистика Дарбина-Уотсона

 = 7,11 / 2,81 = 2,53

Табличные значения при n = 16, m = 2

dl = 0,98; du = 1,54

Так как 4 – du < d < 4 – dl, вопрос о наличии автокорреляции остается открытым (область неопределенности критерия).

Найдем коэффициент парной корреляции между объясняющими переменными.

r12 =  = -0,169

Проверим значимость коэффициента корреляции.

 =  = 0,643 < 1,761

Коэффициент незначим, т.е. мультиколлинеарность не имеет места.

Определитель матрицы коэффициентов парной корреляции:

Det (r) =  = 1 – 0,1692 = 0,971

Табличное значение статистики для df = 1 и α = 0,05 равно

χ21;0,05 = 3,84.

Фактическое значение статистики

 = - (16 – 1 – (2 * 2 + 5) / 6) ln 0,971 = 0,39 < 3,84

Мультиколлинеарность не имеет места, т.е. линейной зависимости между объясняющими переменными (возрастом автомобиля и мощностью двигателя) не существует. Это свидетельствует о надежности оценок параметров модели.