Поле корреляции. Вычисление оценок параметров двумерной модели

 

На практике для вычисления оценок параметров двумерной модели удобно использовать корреляционную таблицу и поле корреляции. Пусть, например, изучается зависимость между объёмом выполненных работ (у) и накладными расходами (х). Имеем выборку из генеральной совокупности, состоящую из 150 пар переменных (). Считаем, что предпосылки корреляционного анализа выполнены.

Пару случайных чисел () можно изобразить графически в виде точки с координатами (). Аналогично можно изобразить весь набор пар случайных чисел (всю выборку). Однако при большом объёме выборки это затруднительно. Задача упрощается, если выборку упорядочить, т.е. переменные сгруппировать. Сгруппированные ряды могут быть как дискретными, так и интервальными.

По осям координат откладывают или дискретные значения переменных, или интервалы их изменения. Для интервального ряда наносят координатную сетку. Каждую пару переменных из данной выборки изображают в виде точки с соответствующими координатами для дискретного ряда или в виде точки в соответствующей клетке для интервального ряда. Такое изображение корреляционной зависимости называют полем корреляции. На рис. 1.1 изображено поле корреляции для выборки, состоящей из 150 пар переменных (ряд интервальный).

Если вычислить средние значения у в каждом интервале изменения х [обозначим их )], нанести эти точки на рис. 1.1 и соединить между собой, то получим ломаную линию, по виду которой можно судить, как в среднем меняются у в зависимости от изменения х. По виду этой линии можно также сделать предположение о форме связи между переменными. В данном случае ломаную линию можно аппроксимировать прямой линией, так как она достаточно хорошо приближается к ней. По выборочным данным можно построить также корреляционную табл. 1.1.

 

Таблица 1.1

Накладные расходы, млн. руб. 1÷2 1,5 2÷3 2,5 3÷4 3,5 4÷5 4,5 5÷6 5,5 6÷7 6,5 7÷8 7,5 8÷9 8,5
Объём выполненных работ, млн. руб.
10÷20            
20÷30          
30÷40    
40÷50  
50÷60  
60÷70    
70÷80            

Корреляционную таблицу, как и поле корреляции, строят по сгруппированному ряду (дискретному или интервальному). Табл. 1.1 построена на основе интервального ряда. В первой строке и первом столбце таблицы помещают интервалы изменения х и у и значения середин интервалов. Так, например, 1,5 — середина интервала изменения х=l÷2,15— середина интервала изменения у=10÷20. В ячейки, образованные пересечением строк и столбцов, заносят частоты попадания пар значений (х, у) в соответствующие интервалы по х и у. Например, частота 4 означает, что в интервал изменения у от 10 до 20 попало 4 пары наблюдавшихся значений. Эти частоты обозначают . В 9-й строке и 10-м столбце находятся значения и - суммы по соответствующим столбцу и строке.

Как будет показано в дальнейшем, корреляционно таблицей удобно пользоваться при вычислении коэффициентов корреляций и параметров уравнений регрессии.

Корреляционная таблица построена на основе интервального ряда, поэтому для оценок параметров воспользуемся формулами гл. 1 для вычисления средней арифметической и дисперсии. Имеем:

(1.6)