Контрольная работа: Эконометрический анализ основных числовых характеристик

Эконометрический анализ основных числовых характеристик

Введем обозначения: Х1 – удельный вес пашни в с/х угодьях, %;

Х2 – удельный вес лугов и пастбищ, %

У – уровень убыточности продукции животноводства, %

Найдем основные числовые характеристики:

1. Объем выборки – суммарное количество наблюдений: n = 15.

2. Минимальное значение х1 – min х1 = 68,1%

максимальное значение х1 – max х1 = 94,7%

Значит, удельный вес пашни в с/х угодьях изменяется от 68,1% до 94,7%.

3.      min х2 = 9,2%, max х2 = 28,7%.

Значит, удельный вес лугов и пастбищ изменяется от 9,2%, до 28,7%.

4.      min у = 15%, max у = 45,6%.

Значит, уровень убыточности продукции животноводства изменяется от 15%% до 45,6%.

5. Среднее значение вычисляется по формуле

Среднее значение удельного веса пашни в с/х угодьях и составляет x1=80,98%

Среднее значение удельного веса лугов и пастбищ составляет х2 = 17,02%

Среднее значение уровня убыточности продукции животноводства составляет у = 28,2%.

6. Дисперсия вычисляется по формуле


 

Дисперсия по х1: D(х1) = 58,83;

по х2: D(х2) = 42,45;

по у: D(у) = 92,96.

7. Среднеквадратичное отклонение вычисляется по формуле:

σх1= 7,67 – значит, среднее отклонение удельного веса пашни в с/х угодьях от среднего значения составляет 7,67%

σх2= 6,52 – значит, среднее отклонение удельного веса лугов и пастбищ от среднего значения составляет 6,52%

σу= 9,642 – значит, среднее отклонение уровня убыточности продукции животноводства от среднего значения составляет 9,642%.

 

Эконометрический анализ

По таблице строим корреляционное поле (диаграмму рассеивания). Нанесем точки хi, уi на координатную плоскость.

Точка с координатами (х; у) = (80,98; 17,15) называется центром рассеивания.

По виду корреляционного поля можно предположить, что зависимость между х и у линейная.

Для определения линейной связи найдем коэффициент корреляции.

r =0,776111538

Т.к. в данном случае коэффициент корреляции 0,6 ≤| r | ≤ 0,9, то линейная связь между х и у достаточная.

Попытаемся описать связь между х и у зависимостью у = b0 + b1x

Параметры b0 и b1 находим по методу наименьших квадратов.

b1 = rху σу/ σх =-0,6520, b0 = у – b1x = 69,9498

Т.к. b1<0, то зависимость между х и у обратная. Т.е. с ростом удельного веса пашни в с/х угодьях, уровень убыточности продукции животноводства уменьшается.

Проверим значимость коэффициентов bi. Значимость может быть проверена с помощью критерия Стьюдента.

Для коэффициента b0:

=5,854852846

Значимость t наблюдаемого: α·tнабл = 0,0001, т.е. 0,01%<5%, значит, коэффициент b0 статистически значим.

Для коэффициента b1:

= -4,437566168

Значимость t наблюдаемого: α·tнабл = 0,0010, т.е. 0,1%<5%,

Значит, коэффициент b1 статистически значим.

Получим модель зависимости уровня убыточности продукции животноводства от удельного веса пашни в с/х угодьях и удельного веса лугов и пастбищ.

у = -0,652х + 69,9498.

После того, как была построена модель, проверяем её на адекватность.

Разброс данных, объясняемый регрессией:

 SSP = 350,083702


Остатки необъясняемые – разброс:

 SSЕ = 231,1136313

Общий разброс данных:

 SSY = 581,1973333

Для анализа общего качества модели найдем коэффициент детерминации.

R2 = SSR/ SSY = 0,57176059

Разброс данных объясняется: линейной моделью на 57,26% и на 42,74% случайными ошибками ((1 – R2)·100%).

Качество модели плохое.

Проверим с помощью критерия Фишера. Для проверки найдем величины:

MSR = SSR / R1 = 350,083702 и MSЕ = SSЕ / R2 = 17,77797164.

Вычисляем k1 = 1 и k2 = 14.

Находим наблюдаемое значение критерия Фишера.

Fнабл = MSR / MSE = 19,6919935.

Значимость этого значения: α = 0,000669742, т.е. процент ошибки равен ≈0,067% < 5%.

Следовательно, модель у = -0,652х + 69,9498 считается адекватной с гарантией более 95%.

Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза.

x  [xmin, xmax]; хпр = 88

Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза.

у(х=88) = у = -0,652х + 69,9498= 12,577

Найдем полуширину доверительного интервала в каждой точке и в точке прогноза.

,

где σе – среднеквадратическое отклонение выборочных точек от линии регрессии

= 4,216393

tγ – критическая точка распределения Стьюдента для надежности

γ =0,95 R = 13;

n = 15 – объем выборки;

сумма знаменателя – ,

где D(x) – дисперсия выборки,

хпр – точка прогноза.

Прогнозируемый доверительный интервал для любой точки х:

, где δ для точки прогноза – δ (х=88) = 9,668, т.е. доверительный интервал для хпр составляет от 2,909 до 22,244 с гарантией 95%.

Совокупность доверительных интервалов для всех х из области прогнозов образует доверительную область.

Т.е. при удельном весе пашни в с/х угодьях 1,458%. уровень убыточности продукции животноводства составит от 2,909% до 22,244%.

Найдем эластичность. Для линейной модели эластичность Ех вычисляется по формуле:

Коэффициент эластичности показывает, что при изменении удельного веса пашни в с/х угодьях на 1% уровень убыточности продукции животноводства уменьшится на 4,593%.

Эконометрический анализ

По таблице строим корреляционное поле (диаграмму рассеивания). Нанесем точки хi, уi на координатную плоскость.

Точка с координатами (х; у) = (17,02; 28,2) называется центром рассеивания.

По виду корреляционного поля можно предположить, что зависимость между х и у нелинейная.

Попытаемся описать связь между х и у зависимостью:

y = a ln x + b.

Перейдем к линейной модели. Делаем линеаризующую подстановку:


U= ln x;      V = y.

Для этих данных строим линейную модель:

V = b0 + b1U.

Для определения линейной связи найдем коэффициент корреляции.

r =0,864

Т.к. в данном случае коэффициент корреляции | r | > 0,9, то линейная связь между U и V сильная.

Попытаемся описать связь между U и V зависимостью

V = b0 + b1U.

Параметры b0 и b1 находим по методу наименьших квадратов.

b1 = r U V σ V / σ U = 370.76,    b0 = V – b1 U = 3.53.

Т.к. b1 > 0, то зависимость между U и V прямая. Т.е. с ростом удельного веса лугов и пастбищ, уровень убыточности продукции животноводства повышается.

Проверим значимость коэффициентов bi. Значимость может быть проверена с помощью критерия Стьюдента.

Для коэффициента b0:

=0,845

Значимость t наблюдаемого: α·tнабл = 0,413221639, т.е. 41%>5%,

Значит, коэффициент b0 статистически не значим.

Для коэффициента b1:

=6,2


Значимость t наблюдаемого: α·tнабл = 3,23039E‑05, т.е. ≈0%<5%,

Значит, коэффициент b1 статистически значим.

Получим модель зависимости уровня убыточности продукции животноводства от удельного веса лугов и пастбищ.

V = 370,76U +3,53.

После того, как была построена модель, проверяем её на адекватность.

Разброс данных, объясняемый регрессией:

 SSP = 972,42

Остатки необъясняемые – разброс:

 SSЕ = 329,1

Общий разброс данных:

 SSY = 1301,51

Для анализа общего качества модели найдем коэффициент детерминации.

R2 = SSR/ SSY = 0.747

Разброс данных объясняется: линейной моделью на 74,7% и на 25,3% случайными ошибками ((1 – R2)·100%).

Качество модели хорошее.

Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 972,42 и MSЕ = SSЕ / R2 = 25,3.

Вычисляем k1 = 1 и k2 = 13.

Находим наблюдаемое значение критерия Фишера.

Fнабл = MSR / MSE = 38.41.

Значимость этого значения: α = 3,23Е‑05, т.е. процент ошибки равен ≈0% < 5%.

Следовательно, модель V = 370,76U +3,53. считается адекватной с гарантией более 95%.

Т.к. линейная модель адекватна, то и соответствующая нелинейная модель то же адекватна. Находим параметры исходной нелинейной модели a и b. Вид нелинейной функции:

y = 370,76/x +3,53.

Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза.

x  [xmin, xmax];

хпр = 17,02, соответственно Uпр= 1/17,02 = 0,06

Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза.

V(х=17,02) = 370,76U +3,53. = 25,32,

у(х=17,02) = 370,76/x +3,53 = 25,32.

Т.к. y(x) = V(U), то полуширина доверительного интервала и доверительный интервал будет равен как для y так и для V.

Найдем полуширину доверительного интервала в каждой точке и в точке прогноза.


,

Прогнозируемый доверительный интервал для любой точки х:

, где δ для точки прогноза – δ (х=17,02) = 11,27 т.е. доверительный интервал для хпр составляет от 8,50 до 12,87 с гарантией 95%.

Совокупность доверительных интервалов для всех х из области прогнозов образует доверительную область.

Т.е. при удельном весе лугов и пастбищ 17,02% уровень убыточности продукции животноводства составит от 14,05% до 36,59%.

Найдем эластичность. Для линейной модели эластичность Ех вычисляется по формуле:

Коэффициент эластичности показывает, что при изменении удельного веса лугов и пастбищ на 1% уровень убыточности продукции животноводства изменяется на 0,86%.

Эконометрический анализ

Прежде, чем строить модель, проверим факторы на коллинеарность. По исходным данным строим корреляционную матрицу. Коэффициент корреляции между х1 и х2 равен:

rх1х2 =-0,79 < 0,95, следовательно х1 и х2 неколлинеарны.

Определим связаны ли х1, х2 и у между собой. Для определения тесноты линейной связи найдем коэффициент корреляции.

r = 0,92

Попытаемся описать связь между х1, х2 и у зависимостью

у = b0 + b1∙х1 + b2 ∙х2

Параметры b0, b1 и b2 находим по методу наименьших квадратов.

b0 = -19.995, b1 = 0.72, b2 = -0.6

Проверим значимость коэффициентов bi. Значимость может быть проверена с помощью критерия Стьюдента.

Для коэффициента b0:

= -0,87

Значимость t наблюдаемого: α·tнабл = 0,40, т.е. 40% > 5%,

Значит, коэффициент b0 статистически не значим.

Для коэффициента b1:

= 3,04

Значимость t наблюдаемого: α·tнабл = 0,01, т.е. 1% < 5%,

Значит, коэффициент b1 статистически значим.

Для коэффициента b2:

= -2,11

Значимость t наблюдаемого: α·tнабл = 0,06, т.е. 6% > 5%,

Значит, коэффициент b2 статистически не значим.

Получим модель зависимости уровня убыточности продукции животноводства от удельного веса пашни в с/х угодьях и и удельного веса лугов и пастбищ.

у = -19,995 + 0,72∙х1 – 0,6∙х2

После того, как была построена модель, проверяем её на адекватность.

Разброс данных, объясняемый регрессией:

 SSP = 1090,3

Остатки необъясняемые – разброс:

 SSЕ = 211,17

Общий разброс данных:

 SSY = 1301,5

Для анализа общего качества модели найдем коэффициент детерминации.

R2 = SSR/ SSY = 0.84

Разброс данных объясняется: линейной моделью на 84% и на 16% случайными ошибками ((1 – R2)·100%).

Качество модели хорошее.

Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 545,17 и MSЕ = SSЕ / R2 = 17,6.

Вычисляем k1 = 2 и k2 = 12.

Находим наблюдаемое значение критерия Фишера.

Fнабл = MSR / MSE = 30.98.

Значимость этого значения: α = 1,82E‑05, т.е. процент ошибки равен ≈0% < 5%.

Следовательно, модель

у = -19,995 + 0,72∙х1 – 0,6 ∙х2 – считается адекватной с гарантией более 95%.

Найдем прогноз на основании линейной регрессии. Выберем произвольную точку из области прогноза.

X1,2  [xmin, xmax]; хпр = (80,98; 17,02)

Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза.

У(80,98;17,02) = у = -19,995 + 0,72∙80,98 – 0,6 ∙17,02=28,17

Найдем коэффициенты частичной эластичности Ех1, Ех2.

Для линейной модели эластичность Ех вычисляется по формуле:

Коэффициент эластичности показывает, что при увеличении удельного веса пашни в с/х угодьях на 1% и удельного веса лугов и пастбищ на 80,98% уровень убыточности продукции животноводства увеличится на 2,064%


Коэффициент эластичности показывает, что при увеличении производительности труда на 1% и удельного веса пашни в с/х угодьях на 17,02% уровень убыточности продукции животноводства уменьшится на 0,354%.