Основы дисперсионного анализа.

Лекция 3. 15.02.13

Вставить

Основная идея дисперсионного анализа состоит в разложении вариации изучаемого признака на составляющие: среднее значение признака У, заштрихованные квадраты точки наблюдений, прямая линия – теоритическая линия регрессии, незаштрихованные – токи теоритических регрессий.

Два вида отклонения от среднего – дельта факторное и дельта остаточное – как значение эмпирическое отличается от теоритического. Общее отклонение от среднего равно

Для каждой точки справедливо соотношение. Дельта общее=дельта факторное+ дельта ост.

Разложим сумму квадратов отклонений значений результирующего признака от среднего значения таким образом.

Вставка

Общая сумма отклонений равна остаточная сумма отклонений и сумма отклонений объясняемых факторов.

Разделим каждую сумму квадратов отклонений на соответствующую ей число степеней свободы и получим дисперсию на 1 степень свободы.

Общая дисперсия на 1 степень свободы:

Остаточная дисперсия характеризующаяся вариацию результирующего признака за счёт факторов не включенных в модель.

Факторная дисперсия, которая характеризует вариацию результирующего признака за счет факторов включенных в модель

 

Проверка адекватности регрессионной модели по критерию Фишера-Снедекора

Проверка адекватности модели по этому критерию проводится путем сравнения факторной дисперсии с остаточной дисперсией.

Вставка Fвыб= сигма2 факт/сигма2/ост

 

Если остаточная дисперсия много меньше чем факторная F>1 то считается что факторный признак существенным образом влияет на результирующий признак т е модель адекватна.

 

Проверка адекватности модели по критерию Фишера производится следующим образом.

1. Выдвигаем нуль гипотезу. H0 – модель неадекватна, те заложенные в уравнение регрессии связи не отвечают реально существующим.

2. Альфа =0,05 (5%), те зрительная вероятность 95%

3. Проверяем статистическое правило. Fвыб <F крит, то гипотеза Н0 не отвергается, если наоборот то гипотеза отвергается и модель статистической значимости принимается.

4. Считаем по формуле. Fвыб =

5. По справочным таблицам Фишера найдем критическое значение Фкрит. Фкр=Ф(альфа; К1=К-1; К2=н-к)

 

Пример проверим адекватность модели на основе Ф примера Фишера для примера о 10 предприятиях.

Фвыб=34,246/5,754*8/1=47,6

Фвыб>Фкрит, то с 95% доверительной вероятностью нулевая гипотеза Н0 отвергается, то модель адекватна или статистически значима по критерию Фишера.

 

МНОЖЕСТВЕННАЯ (МНОГОФАКТОРНАЯ) РЕГРЕССИЯ

Модель множественной регрессии - этоуравнение отражающая корреляционную связь между результатом и несколькими факторами.

построение модели множественной регрессии начинается с процесса отбора факторов, т.е. главновлияющих переменных в модель.

Имеются 2 наиболее распространенных алгоритма отбора факторов.

 

1 путь шаговый регрессионный анализ основанный на методе последовательного включения факторов. Алгоритм проведения отбора факторов снизу.

Этот метод предполагает что сначала будет построена модель с фактором наиболее тесно связанная с результатом. Затем поочередно добавляются другие факторы, каждый раз при этом оценивается целесообразность включения нового фактора с точки зрения сокращения остаточной дисперсии и увеличение величины коэффициента множественной корреляции.

Для того что бы осуществить этот отбор рассчитывают парный коэффициент корреляции результирующего признака и каждого из факторов, при этом устанавливается некоторое пороговое значение (ру1) и если значение коэффициента корреляции rxy>ro1 вставка то соответствующий фактор включается в модель. Далее рассчитывается парный коэффициент корреляции самих факторов. Между факторами включаемыми в модель связь должна быть неочень сильной не очень тесной, поэтому вводят второе пороговое значение (ро2). Если значение rxixj<ro2 то оба фактора включаются в модель.

Для выполнения этого анализа формируется матрица коэффициентов корреляции

  y X1 X2 Xn
Y Ryx1 Ryx2 ryn
X1   Rx1x2 Rx1xn
X2     Rx2xn
       
Xn      

Rxiyj=rxixj

Расчёт и инерпритация коэффициентов уравнений множественной регрессии.

Как и в случае парной регрессии коэффициенты уравнения множественной регрессии определяются по методу наименьших квадратов. Из условий минимума функционала S.

Для минимизации функционала приравняем к нулю все частные производные по соответствующим коэффициентам регрессии.

Вставка

После решения системы получаем

Вставка

Функция в екселе линейная.

Интерпритация модели коэффициенты регрессий бетта 2 и бетта 3 указывают гна изменение результирующего признака У при изменнии соотвтетствующего факторного признака на 1.

Коэффицент бетта 2 = х1 бетта 3 . Для сравнения степени влияния факторных признаков на результирующий признаккоэффициенты регрессий бетта 2 и бетта 3 указывают гна изменение результирующего признака У при изменнии соотвтетствующего факторного признака на 1.

Коэффицент бетта 2 = х1 бетта 3 . Для сравнения степени влияния факторных признаков на результирующий признак используют средние частыне коэффициенты эластичности.

Втавка

Эти коэффициенты показывают насколько % в среднем изменится результирующий признак при изменении факторного признака на 1%

Шапка. ФГБОУ ВПО РЭУ Кафедра математические методы в экономике.

Контрольное работа №1 Однофакторные регресии. Группы Фио препод