О связях функциональных и статистических

Корреляционный анализ

Текст лекции

Лекция 18 Регрессионный анализ, корреляционный анализ

Учебные и воспитательные цели:

1. Дать представление о регрессионном анализе и корреляционном анализе.

Вид занятия:лекция.

Продолжительность занятия:90 минут.

Учебно-материальное обеспечение занятия:

Медиа-проектор, ноутбук, слайды Power Point (Оверхэд-проектор, слайды).

Литература:

а) основная:

1. Иванова В.М., Калинина В.Н., Нешумова Л.А., Решетникова И.О. Математическая статистика. 2-е изд., перераб. и доп. – М.: Высш. школа, 1981. – 371 с., ил.

 

Структура занятия и расчёт времени

Структура занятия Время, мин
I. Вводная часть занятия
II. Основная часть занятия
Введение в лекцию
1. Корреляционный анализ
2. Регрессионный анализ
Заключение по лекции
III. Заключительная часть занятия

 

Введение в лекцию:

В материалах сегодняшней лекции мы рассмотрим характеристики вариационного ряда.

Учебные вопросы лекции:

 

Связи между различными явлениями в природе сложны и многообразны, однако их можно определённым образом классифицировать. В технике и естествознании часто речь идёт о функциональной зависимости между переменными х и у, когда каждому возможному значению х поставлено в однозначное соответствие определённое значение у. Это может быть, например, зависимость между давлением и объёмом газа (закон Бойля—Мариотта).

В реальном мире многие явления природы происходят в обстановке действия многочисленных факторов, влияния каждого из которых ничтожно, а число их велико. В этом случае связь теряет свою однозначность и изучаемая физическая система переходит не в определённое состояние, а в одно из возможных для неё состояний. Здесь речь может идти лишь о так называемой статистической связи. Статистическая связь состоит в том, что одна случайная переменная реагирует на изменение другой изменением своего закона распределения. Следовательно, для изучения статистической зависимости нужно знать аналитический вид двумерного распределения. Однако нахождение аналитического вида двумерного распределения по выборке ограниченного объёма, во-первых, громоздко, во-вторых, может привести к значительным ошибкам. Поэтому на практике при исследовании зависимостей между случайными переменными X и Y обычно ограничиваются изучением зависимости между одной из них и условным математическим ожиданием другой, т.е. или где M(Y/X=x) — математическое ожидание случайной величины Y при условии, что случайная величина X приняла значение х. Аналогично для М(Х|Y=y).

Вопрос о том, что принять за зависимую переменную, а что — за независимую, следует решать применительно к каждому конкретному случаю.

Знание статистической зависимости между случайными переменными имеет большое практическое значение: с её помощью можно прогнозировать значение зависимой случайной переменной в предположении, что независимая переменная примет определенное значение. Однако, поскольку понятие статистической зависимости относится к осредненным условиям, прогнозы не могут быть безошибочными. Применяя некоторые вероятностные методы, как будет показано далее, можно вычислить вероятность того, что ошибка прогноза не выйдет за определенные границы.