Контрольная работа: Математическая статистика

ПО ДИСЦИПЛИНЕ

«Математическая статистика»


Задания к контрольной работе

 

1. Генеральная совокупность. Выборка. Объем выборки. Среднее значение. Дисперсия. Среднеквадратическое отклонение.

2. Найти коэффициент эластичности для указанной модели в заданной точке X. Сделать экономический вывод. Модель : ; X = 4;

3. Для представленных данных выполнить следующее задание:

3.1 Провести эконометрический анализ линейной зависимости показателя от первого фактора. Сделать прогноз для любой точки из области прогноза, построить доверительную область. Найти коэффициент эластичности в точке прогноза.

3.2 Провести эконометрический анализ нелинейной зависимости показателя от второго фактора, воспользовавшись подсказкой. Сделать прогноз для любой точки из области прогноза, построить доверительную область. Найти коэффициент эластичности в точке прогноза.

3.3 Провести эконометрический анализ линейной зависимости показателя от двух факторов. Сделать точечный прогноз для любой точки из области прогноза. Найти частичные коэффициенты эластичности в точке прогноза.

Производительность труда, фондоотдача и уровень рентабельности по хлебозаводам области за год характеризуются следующими данными:

№ завода Фактор

Уровень рентабельности,

%

Фондоотдача, грн Производительность труда, грн
1 38,9 3742 10,7
2 33,3 2983 11,3
3 37,7 3000 12,2
4 31,1 2537 12,4
5 29,4 2421 10,9
6 37,2 3047 11,3
7 35,6 3002 11,1
8 34,1 2887 14,0
9 16,1 2177 6,8
10 22,8 2141 7,1
11 21,7 2005 8,9
12 26,8 1843 4,2
13 23,3 2031 7,4
14 24,5 2340 11,4
15 19,9 1933 4,8

Нелинейную зависимость принять


1. Генеральная совокупность. Выборка. Объем выборки. Среднее значение. Дисперсия. Среднеквадратическое отклонение

Генеральная совокупность - вся изучаемая выборочным методом статистическая совокупность объектов и/или явлений общественной жизни, имеющих общие качественные признаки или количественные переменные.

Выборочная совокупность (выборка)- часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение о всей генеральной совокупности.

Для того, чтобы заключение, полученное путем изучения выборки , можно было распространить на всю генеральную совокупность выборка должна обладать свойством репрезентативности.

Объем выборки - общее число единиц наблюдения в выборочной совокупности. Определение объема выборки представляет собой один из основных этапов ее формирования. Объем выборки для генеральной совокупности обозначается– N, для выборки – n.

Среднее значение выборки можно вычислить по формуле:

Дисперсия (от лат. dispersio - рассеяние), в математической статистике и теории вероятностей, наиболее употребительная мера рассеивания, т. е. отклонения от среднего. Дисперсия вычисляется по формуле:

 - простая дисперсия,

 - взвешенная дисперсия.


Дисперсия есть средняя величина квадратов отклонений. Для этого достаточно извлечь из дисперсии корень второй степени, получится среднее квадратическое отклонение ().

или

.

Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности.

 

2. Найти коэффициент эластичности для указанной модели в заданной точке X. Сделать экономический анализ

Известно, что коэффициент эластичности показывает, на сколько процентов изменится в среднем результат, если фактор изменится на 1 %. Формула расчета коэффициента эластичности:

Э = f′(x)X/Y,

где f′(x) – первая производная, характеризующая соотношение прироста результата и фактора для соответствующей формы связи.

,

.

Следовательно получим следующее математическое выражение

.

При заданном значении X=4 получим, что коэффициент эластичности равен  Э=0,25.

Допустим, что заданная функция  определяет зависимость спроса от цены. В этом случае с ростом цены на 4% спрос повысится в среднем на 0,25 %.

 

3. Производительность труда, фондоотдача и уровень рентабельности по хлебозаводам области за год характеризуются следующими данными:

№ завода Фактор

Уровень рентабельности,

%

Фондоотдача, грн Производительность труда, грн
1 38,9 3742 10,7
2 33,3 2983 11,3
3 37,7 3000 12,2
4 31,1 2537 12,4
5 29,4 2421 10,9
6 37,2 3047 11,3
7 35,6 3002 11,1
8 34,1 2887 14,0
9 16,1 2177 6,8
10 22,8 2141 7,1
11 21,7 2005 8,9
12 26,8 1843 4,2
13 23,3 2031 7,4
14 24,5 2340 11,4
15 19,9 1933 4,8

Нелинейную зависимость принять

Последовательность выполнения задания 3

1. Вводим данные .Определяем основные числовые характеристики.

2. Строим диаграмму рассеивания (корреляционное поле).

3. Определяем тесноту линейной связи по коэффициенту корреляции.

4. Строим линейную модель вида у = bо + b1*х.

5. Определяем общее качество модели по коэффициенту детерминации R2. Проверяем полученную модель на адекватность по критерию Фишера

6. Проверяем статистическую значимость коэффициентов модели.

7. По полученной модели рассчитываем значение показателя Y для всех точек выборки и в точке прогноза (точку прогноза выбираем произвольно из области прогноза).

8. Рассчитаем полуширину доверительного интервала d. =

9. Рассчитаем доверительный интервал для всех точек выборки и в точке прогноза: (Y-d, Y +d).

10. Рассчитываем коэффициент эластичности:

 Для линейной модели yх = b1. Получим

 , где у(х) - рассчитанное по модели значение показателя.

11. Строим, используя «Мастер диаграмм», корреляционное поле, график эластичности и доверительную область.

12. Делаем лист с формулами.

Решение 1:

1. Вводим данные. Определяем основные статистики. Строим корреляционное поле. По виду корреляционного поля выдвигаем гипотезу о нелинейной зависимости между X и Y.

2. С помощью формул перехода линеаризуем нелинейную модель:  , V=у. Получаем линейную модель относительно новых переменных

V = b0 + b1u

3. Рассчитываем основные числовые характеристики X, Y, V, U с помощью «Мастера функций» и функции «Описательная статистика».

4. Продолжим регрессионный анализ с помощью вкладки «Анализ данных» и функции «Регрессия».

5. Вычислим значения V(U),V min, V max.

6. Рассчитаем полуширину доверительного интервала d .

7. По формулам обратного перехода пересчитываем значения Y, Ymin (левая граница доверительного интервала»,Ymaх(правая граница доверительного интервала).

8. Рассчитываем коэффициент эластичности

,

9. Строим доверительные области V(U) и Y(х) и график эластичности.

10. Делаем лист с формулами.

Решение 2:

1. Вводим данные.

2. Определяем основные статистики.

3. По корреляционной таблице проверяем факторы на коллинеарность.

4. Строим линейную модель вида y = b0+b1х+b2х.

5. Определяем общее качество модели по коэффициенту детерминации R2. Проверяем полученную модель на адекватность по критерию Фишера.

6. Проверяем статистическую значимость коэффициентов модели.

7. По полученной модели рассчитываем значения показателя Y для всех точек выборки и в точке прогноза(точку прогноза выбрали произвольно из области прогноза).

8. Рассчитываем частичные коэффициенты эластичности:

- по фактору X1

- по фактору Х2


4. Экономический анализ

Обозначим Фондоотдачу (грн.) – Х, Уровень рентабельности (%) – Y. Найдем основные числовые характеристики.

Объем выборки n=15 ‑ суммарное количество наблюдений.

Фондоотдача изменяется от 16,1 до 38,9 грн., уровень рентабельности изменяется от 4,2 до 14%.

Среднее значение фондоотдачи составляет 28,83 грн, среднее значение уровня рентабельности составляет 9,63%.

Среднее значение можно вычислить по формуле: .

Дисперсия .

Среднеквадратическое отклонение 7,23, значит среднее отклонение фондоотдачи от среднего значения, составляет 7,23 грн.,  2,92, значит среднее отклонение уровня рентабельности от среднего значения, составляет 2,92%.

Определим, связаны ли X и У между собой, и, если да, то определить формулу связи.

По таблице строим корреляционное поле (диаграмму рассеивания) - нанесем точки (X, Y) на график. Точка с координатами () =(28,83;9.63) называется центром рассеяния.

По виду корреляционного поля можно предположить, что зависимость между Y и X линейная.

Для определения тесноты линейной связи найдем коэффициент корреляции (из таблицы регрессионная статистика):

.

Так как , то линейная связь между X и Y достаточная.

Пытаемся описать связь между X и Y зависимостью .

Параметры  находим по методу наименьших квадратов.

Так как , то зависимость между X и Y прямая: с ростом фондоотдачи уровень рентабельности повышается. Проверим значимость коэффициентов .

Значимость коэффициента может быть проверена с помощью критерия Стьюдента:

.

Значимость  равна . Это меньше 5%. Коэффициент  статистически значим.

.

Значимость  равна , что практически равно 0%. Это меньше 5%. Коэффициент  статистически значим.

Проверим модель на адекватность. Проанализировав таблицу Дисперсионный анализ можно сказать, разброс данных, объясняемый регрессией . Остатки, необъясненный разброс . Общий разброс данных . Коэффициент детерминации . Разброс данных объясняется на 50,49% линейной моделью и на 49,51% - случайными ошибками.

Проверим модель с помощью критерия Фишера. Для проверки найдем величины:  и . Вычисляем  и . Находим наблюдаемое значение критерия Фишера . Значимость этого критерия , т.е. процент ошибки практически равен 0%, что меньше чем 5%. Модель  считается адекватной с гарантией более 95%.

Найдем прогноз.

Примем за точку прогноза значение фондоотдачи 33 грн.

Рассчитываем прогнозные значения по модели для всех точек выборки и для точки прогноза:

.

Построим доверительную область для точки прогноза и всех точек.

Найдем полуширину доверительного интервала в каждой точке выборки:

,

где  - среднеквадратическое отклонение выборочных точек от линии регрессии; ;

 ‑ критическая точка распределения Стьюдента для надежности  и ; .

Прогнозируемый доверительный интервал для любого x такой , где , т.е. доверительный интервал для  составит от 6,0157 до 15,6503 с гарантией 95%., т.е. при фондоотдаче 33 грн. Уровень рентабельности составит от 6,0157% до 15,6503%.

Найдем эластичность.

Для линейной модели

Коэффициент эластичности показывает, что при изменении фондоотдачи на 1% уровень рентабельности увеличится с 10,83% на 0,876%. Т.е. при увеличении фондоотдачи рентабельность растет.

Задание № 3.2

Обозначим производительность труда в расчете на одного работника (грн.) – Х, Уровень рентабельности (%) – Y. Построим нелинейную зависимость показателя от фактора вида . Проанализируем фактор X, используя таблицу описательная статистика.

Производительность труда в расчете на одного работника изменяется от 1843 до 3742 грн. Средняя производительность составляет 2535,27 грн. Отклонение от среднего составляет 546,96.

Определим, связаны ли X и У между собой, и, если да, то определить формулу связи.

По таблице строим корреляционное поле (диаграмму рассеивания) - нанесем точки (X, Y) на график.

По виду корреляционного поля можно предположить, что зависимость между Y и X нелинейная.

Пытаемся описать связь между X и Y зависимостью .

Перейдем к линейной модели. Делаем линеаризующую подстановку: . Получим новые данные U и V. Для этих данных строим линейную модель: . Проверим тесноту линейной связи U и V. Найдем коэффициент корреляции (из таблицы Регрессионная статистика): .Между U и V достаточная связь.

Параметры  находим по методу наименьших квадратов.


Значимость коэффициента может быть проверена с помощью критерия Стьюдента:

.

Значимость  равна 0,0021, что практически равно 0%. Это меньше 5%. Коэффициент  статистически значим.

.

Значимость  равна0,00083, что практически равно 0%. Это меньше 5%. Коэффициент  статистически значим.

Получили линейную модель .

Проверим модель на адекватность. Проанализировав таблицу дисперсионный анализ можно сказать, разброс данных, объясняемый регрессией . Остатки, необъясненный разброс . Общий разброс данных . Коэффициент детерминации . Разброс данных объясняется на 59,92% линейной моделью и на 40,08% - случайными ошибками.

Проверим модель с помощью критерия Фишера. Для проверки найдем величины:  и . Вычисляем  и . Находим наблюдаемое значение критерия Фишера . Значимость этого критерия , т.е. процент ошибки практически равен 0%, что меньше чем 5%. Модель  считается адекватной с гарантией более 95%. Так как линейная модель адекватна, то и соответствующая ей нелинейная модель адекватна. Находим параметры исходной нелинейной модели: ; .

Вид нелинейной функции: . Таким образом, можно сказать, что зависимость уровня рентабельности от производительности труда можно описать следующей функцией: .

Найдем прогноз. Примем за точку прогноза значение производительности труда 2500 грн.

Рассчитываем прогнозные значения по модели для всех точек выборки и для точки прогноза: .

.

Построим доверительную область для точки прогноза и всех точек.

Найдем полуширину доверительного интервала в каждой точке выборки:

,

где  - среднеквадратическое отклонение выборочных точек от линии регрессии; ;

 ‑ критическая точка распределения Стьюдента для надежности  и ; .

Прогнозируемый доверительный интервал для любого x такой , где , т.е. доверительный интервал для  составит от 5,35 до 14,03 с гарантией 95%., т.е. при производительности 2500 грн. Уровень рентабельности составит от 5,35% до 14,03%.

Для нелинейной модели найдем доверительный интервал, воспользовавшись обратной заменой: . Совокупность доверительных интервалов для всех X из области прогнозов образует доверительную область.

Найдем эластичность.

Для линейной модели   тогда .

Коэффициент эластичности для точки прогноза:

Коэффициент эластичности показывает, что при увеличении производительности на 1% уровень рентабельности увеличится с 9,69% на 1.1%. Т.е. при увеличении производительности труда рентабельность растет.

Задание № 3.3

Обозначим Фондоотдачу (грн.) – Х1, Производительность труда в расчете на одного работника (грн) – X2, Уровень рентабельности (%) – Y. Построим линейную зависимость показателя от факторов.

Прежде чем строить модель проверим факторы на коллинеарность. По исходным данным строим корреляционную матрицу. Коэффициент корреляции между X1 и X2 равен 0,87. Так как , значит X1 и X2 – неколлинеарные факторы. Пытаемся описать связь между X и Y зависимостью .

Параметры  находим по методу наименьших квадратов.

.

Проверим значимость коэффициентов .

Значимость коэффициента может быть проверена с помощью критерия Стьюдента:

.

Значимость  равна 0,99, т.е 99% больше 5%. Коэффициент  статистически незначим.

.

Значимость  равна , т.е. 39,6%, что больше 5%. Коэффициент  статистически незначим.

.

Значимость  равна , т.е. 35%, что больше 5%. Коэффициент  статистически незначим.

Проверим модель на адекватность.

Проанализировав таблицу дисперсионный анализ можно сказать, разброс данных, объясняемый регрессией . Остатки, необъясненный разброс . Общий разброс данных . Коэффициент детерминации . Разброс данных объясняется на 54,11% линейной моделью и на 45,89% - случайными ошибками.

Проверим модель с помощью критерия Фишера. Для проверки найдем величины:  и . Вычисляем  и . Находим наблюдаемое значение критерия Фишера . Значимость этого критерия , т.е. процент ошибки практически равен 0%, что меньше чем 5%.

Модель считается адекватной с гарантией более 95%.

Из полученной модели можно сделать вывод, что уровень рентабельности от фондоотдачи и производительности труда описывается следующей зависимостью:

Найдем прогноз.

Примем за точку прогноза значение производительности труда 25000 грн, фондоотдачи 33 грн. Получили при данных условиях уровень рентабельности

Рассчитываем прогнозные значения по модели для всех точек выборки и для точки прогноза:

.

Найдем эластичность по каждому фактору.

Для линейной модели , т.е. при производительности труда 2500 грн. и увеличении фондоотдачи с 33 грн. на 1% уровень рентабельности снижается на 0,4736%.

, т.е. при фондоотдаче 33 грн и увеличении производительности труда с 2500 грн. на 1% уровень рентабельности увеличивается на 0,5243%.

Значит для увеличения рентабельности целесообразнее увеличивать производительность труда.