Контрольная работа: Cтатистическая надежность регрессионного моделирования
Вариант 4-1
1. Рассчитайте параметры уравнения линейной регрессии
2. Оцените тесноту связи с помощью показателей корреляции и детерминации
3. Определите среднюю ошибку аппроксимации. Сделайте выводы
4. Оцените статистическую надежность регрессионного моделирования с помощью F-критерия Фишера и t-критерия Стьюдента
5. Оцените полученные результаты, оформите выводы
№ набл. | Район | Средний размер назначенных ежемесячных пенсий, тыс.руб., y | Прожиточный минимум в среднем на одного пенсионера в месяц, тыс.руб., x | |
1 | Брянская обл. | 240 | 178 | |
2 | Владимирская обл. | 226 | 202 | |
3 | Ивановская обл. | 221 | 197 | |
4 | Калужская обл. | 226 | 201 | |
5 | Костромская обл. | 220 | 189 | |
6 | г.Моска | 250 | 302 | |
7 | Москавская обл. | 237 | 215 | |
8 | Орловская обл. | 232 | 166 | |
9 | Рязанская обл. | 215 | 199 | |
10 | Смоленская обл. | 220 | 180 | |
11 | Тверская обл. | 222 | 181 | |
12 | Тульская обл. | 231 | 186 | |
13 | Ярославская обл. | 229 | 250 | |
Fтабл.=4,84(α =0,05) |
=9,29 | =34,75 |
1. Расчет параметров уравнения линейной регрессии по данным таблицы:
Решение:
1. Уравнение линейной регрессии имеет следующий вид:
№ наблюдения |
х |
y |
X2 |
X·Y |
yx |
y- yx |
Ai |
|
1 | 178 | 240 | 31684 | 42720 | 222,51 | 17,49 | 7,29 | |
2 | 202 | 226 | 40804 | 45652 | 227,67 | -1,67 | 0,74 | |
3 | 197 | 221 | 38809 | 43537 | 226,59 | -5,59 | 2,53 | |
4 | 201 | 226 | 40401 | 45426 | 227,45 | -1,45 | 0,64 | |
5 | 189 | 220 | 35721 | 41580 | 224,87 | -4,87 | 2,22 | |
6 | 302 | 250 | 91204 | 75500 | 249,17 | 0,83 | 0,33 | |
7 | 215 | 237 | 46225 | 50955 | 230,46 | 6,54 | 2,76 | |
8 | 166 | 232 | 27556 | 38512 | 219,93 | 12,07 | 5,20 | |
9 | 199 | 215 | 39601 | 42785 | 227,02 | -12,02 | 5,59 | |
10 | 180 | 220 | 32400 | 39600 | 222,94 | -2,94 | 1,34 | |
11 | 181 | 222 | 32761 | 40182 | 223,15 | -1,15 | 0,52 | |
12 | 186 | 231 | 34596 | 42966 | 224,23 | 6,77 | 2,93 | |
13 | 250 | 229 | 62500 | 57250 | 237,99 | -8,99 | 3,93 | |
Сумма |
2646 | 2969 | 554262 | 606665 | ||||
Ср. значение |
203,54 | 228,38 | 42635,54 | 46666,54 | 2,77 | |||
Найдем b:
Тогда
Уравнение линейной регрессии имеет вид:
ŷx =184,239+0,215x
2. а) Рассчитываем коэффициент корреляции:
по формуле:
rxy = b — = 0,21 =0,78
с помощью статистической функции КОРРЕЛ-r =0,78
Связь между переменными x и y прямая, средняя, близкая к сильной, т.е. величина среднемесячной пенсии в значительной мере зависит от прожиточного минимума в среднем на одного пенсионера в месяц
б) Для определения средней ошибки аппроксимации рассчитываем столбцы
yx , y- yx , Ai :
Ai = y- yx * 100, А = 1/n∑ni=1 Ai
Получаем значение средней ошибки аппроксимации
А = 2,77%
Величина ошибки аппроксимации говорит о хорошем качестве модели.
в) Величина коэффициента детерминации получена с помощью функции
ЛИНЕЙН R2 = rxy2 = 0,61,
то есть в 61% случаев изменения среднемесячного прожиточного минимума на одного пенсионера приводят к изменению среднемесячной пенсии. Другими словами – точность подбора регрессии 61 % - средняя.
3. Оценка статистической значимости
а) по критерию Фишера:
1. Выдвигаем нулевую гипотезу о статистической незначимости параметров регрессии и показателя корреляции а = b = rxy =0;
2. Фактическое значение критерия получено из функции ЛИНЕЙН
∑(ỹx-y)²/m r²xy0,61
Fфакт= = (n-2) = (13-2) = 1,56*11 = 17,2;
∑(y-ỹ)² /(n-m-1) 1-r²xy 1-0,61
3. Fтабл =4,84
4. Сравниваем фактическое и табличное значения критерия Fфакт> Fтабл , т.е.нулевую гипотезу отклоняем и делаем вывод о статистической значимости и надежности полученной модели.
б) по критерию Стьюдента:
1. Выдвигаем гипотезу о статистически незначимом отличии показателей от нуля: a = b = r²xy = 0;
2. Табличное значение t – критерия зависит от числа степеней свободы и заданного уровня значимости α. Уровень значимости – это вероятность отвергнуть правильную гипотезу.
rxy √(n-m)
t=
√(1- r2xy)
Где n – количество наблюдений; m – количество факторов.
t= 0,78√(13-2)= 2,59=4,18
√(1-0,61)0,62
3. Фактические значения t-критерия рассчитываются отдельно для каждого параметра модели. С этой целью сначала определяются случайные ошибки параметров mа , mb, mrxy .
mа=Sост √∑х2 = 1,65;
mb= Sост = 0,004
nσх σх√n
mrxy= √(1- r2xy) = 0,062
n-m-1
где Sост=√(∑ (y- yx ) ) = 5 = 0,5
n-m-110
Рассчитываем фактические значения t – критерия:
tфа =a/ mа =111,66
tфb =b/ mb =53,75
tфrxy= rxy/mrxy = 12,58
tфа>tтабл ; tфb>tтабл ; tфrxy >tтабл . Нулевую гипотезу отклоняем , параметры a, b, rxy - не случайно отличаются от нуля и являются статистически значимыми и надежными.