Курсовая работа: Зависимость потребления бензина от количества автомобилей

Кафедра высшей математики

Курсовая работа

по теории вероятностей и математической статистике

на тему:

« Зависимость потребления бензина от количества автомобилей »

Дубна, 2003

Оглавление

ВВЕДЕНИЕ

ПОСТАНОВКА ЗАДАЧИ

ДИАГРАММА РАССЕИВАНИЯ

ПОСТРОЕНИЕ ПРЯМОЙ Y=AX+B, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI)В СРЕДНЕМ КВАДРАТИЧНОМ

ПОСТРОЕНИЕ КРИВОЙ Y=PX2+QX+R, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI) В СРЕДНЕМ КВАДРАТИЧНОМ

АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ И ВЫВОД О ЗАВИСИМОСТИ XI И YI

ВЫВОД

СПИСОК ЛИТЕРАТУРЫ


Введение

         В данной работе исследуется зависимость потребления бензина в городе от количества автомобилей с помощью методов математической статистики.

Бензин – смесь легких углеводородов с tкип 30-205 °C; прозрачная жидкость, плотность 0,70-0,78 г/см3. Получают главным образом перегонкой или крекингом нефти. Топливо для карбюраторных авто- и авиадвигателей; экстрагент и растворитель для жиров, смол, каучуков.

Автомобиль – транспортная безрельсовая машина главным образом на колесном ходу, приводимая в движение собственным двигателем (внутреннего сгорания, электрическим или паровым). Различают автомобили пассажирские (легковые и автобусы), грузовые, специальные (пожарные, санитарные и др.) и гоночные. Скорость легковых автомобилей до 300 км/ч, гоночных до 1020 км/ч (1993), грузоподъемность грузовых автомобилей до 180 т.

Обычно в любой области науки при изучении двух величин проводятся эксперименты, и задача состоит в том, чтобы на основании экспериментальных точек выявить функциональную зависимость.

Если мы рассматриваем слабо формализованные системы, которые трудно поддаются однозначным и точным описаниям, связь между величинами X и Y изначально корреляционная. Это связано, что Y зависит не только от X, но и от других параметров.

В этом случае, задача состоит в том, чтобы приближённо свести корреляционную связь к функциональной с помощью подбора такой функции, которая максимально возможным способом была бы близка к экспериментальным точкам. Такая функция называется функцией регрессии.

Обычно вид самой функции угадывается, но она зависит от некоторых параметров. Задача статистического и корреляционного анализа состоит в нахождении этих параметров. Для этого и используется метод наименьших квадратов.

 
Постановка задачи

 

Даны выборки

 – количество автомобилей,  – потребление бензина.

Задача состоит в изучении характера зависимости

1. Изобразить точки () на плоскости (на миллиметровой бумаге и в виде точечного графика на компьютере)

2. Методом наименьших квадратов определить числа  такие, что прямая  наименее уклоняется от точек () в среднем квадратичном.

3. Методом наименьших квадратов определить числа  такие, что парабола наименее уклоняется от точек () в среднем квадратичном.

4. Сравнить между собой результаты пунктов 2. и 3.

5. С помощью сравнения статистик

где   объем выборки, ответить на вопросы:

1) Подтвердилась ли гипотеза о том, что зависимость между  и  близка к линейной ?

2) Подтвердилась ли гипотеза о том, что зависимость между и

близка к квадратичной?

3) Какая из двух кривых - прямая или парабола - меньше отклоняется от точек выборки () ?


Диаграмма рассеивания

         Даны выборки  и , которые можно интерпретировать следующим образом: — потребление бензина,  — количество автомобилей. Задача состоит в изучении характера зависимости между  и . Исходные выборки представлены в таблице:

X Y X Y X Y X Y
8,64558 116,76 22,2483 112,8 35,3723 113,328 48,6586 125,396
9,30954 115,72 22,38 114,03 35,8685 119,397 49,2468 126,783
9,54538 109,996 22,743 114,952 36,0494 124,624 49,0515 125,652
9,91695 126,634 23,0127 117,027 36,5302 118,734 49,7645 119,88
10,3459 112,28 23,9216 110,664 36,7256 126,531 50,6983 129,604
11,1794 115,564 24,7213 120,474 37,2568 125,601 50,4538 125,877
12,0403 116,048 25,2151 120,749 38,6184 121,974 51,7368 124,935
12,4383 114,524 25,5633 125,365 38,669 123,196 52,3859 121,572
12,8887 114,716 26,5224 117,494 39,2617 119,925 52,932 127,416
13,3673 107,328 26,654 112,982 40,1783 122,293 53,1557 123,507
13,5643 114,422 26,7975 112,34 40,239 120,465 54,0261 128,29
14,4435 118,925 27,6272 127,172 41,1804 122,419 54,4972 136,727
14,4909 123,297 28,2653 121,229 40,8874 127,014 54,3892 125,732
15,3408 119,606 28,6799 119,246 42,0704 133,402 55,475 124,107
15,5866 116,443 28,9424 113,728 42,7372 136,142 55,7691 128,79
16,9966 119,384 29,8652 124,189 42,8423 123,36 55,912 139,417
17,4323 116,428 30,2303 131,775 43,6994 128,363 56,6281 127,151
17,2341 123,058 30,6092 113,164 44,4041 118,225 57,6097 130,697
17,7988 116,349 31,6162 122,517 45,0372 126,604 57,3441 142,839
18,5831 116,665 32,1788 117,256 45,1258 127,831 58,699 134,079
19,4722 118,844 32,7243 114,794 45,4427 122,39 59,0407 130,316
19,8208 123,205 32,7933 130,624 46,3461 129,182 59,3109 129,148
20,6594 109,789 33,1236 133,529 46,5863 127,344 59,8175 135,398
20,8651 118,634 34,0453 123,582 47,3429 124,694 60,3217 131,061
21,0348 110,347 34,9061 135,169 47,7225 117,103 61,2562 126,388

Изобразим эти точки в виде точечного графика с соответствующими координатами (, ); для этого надо найти размах выборки по X и Y и выбрать соответствующий масштаб. Сначала находим  и , затем размах выборки по X, которая вычисляется по формуле  и в результате равна 52,61062. Аналогично  и , а размах выборки поY получим равный 35,511. Глядя на размах выборок по X и по Y, выбираем масштаб диаграммы рассеивания и строим её.

рис.1. Диаграмма рассеивания

По формуле  где

можно найти коэффициент корреляции:

Он не равен нулю, следовательно, зависимость между X и Y существует.


Построение прямой y=ax+b, наименее отклоняющейся от точек (Xi;Yi)в среднем квадратичном

Для построения прямой y = ax + b, наименее отклоняющейся от точек  в среднем квадратичном, необходимо методом наименьших квадратов определить числа a, b такие, что функция двух переменных  принимает минимальное значение. Данная функция имеет вид:

.

Зная, что необходимым условием минимума функции является равенство нулю ее первых частных производных, имеем следующую систему для нахождения значений :

,

Данная система может быть представлена в виде:

,

где

В результате получим что:

Докажем теперь, что в точке  функция  имеет минимум. Достаточным условием существования экстремума функции двух переменных является следующее неравенство:

.

Для доказательства введем следующие обозначения:

Составим дискриминант . Тогда, если , то функция имеет в точке экстремум, а именно минимум при А>0 (или С>0). Из системы видно, что эти условия выполняются: = , С=200>0.

То есть точка  действительно является точкой минимума.

Следовательно, функция  при данных значениях  имеет следующий график:


рис.2. График уравнения линейной регрессии

Построение кривой y=px2+qx+r, наименее отклоняющейся от точек (Xi;Yi) в среднем квадратичном

Для построения кривой , наименее отклоняющейся от точек  в среднем квадратичном, необходимо методом наименьших квадратов определить числа ,  и  такие, что функция трех переменных  принимает минимальное значение. Данная функция имеет вид:

Аналогично нахождению значений  для прямой  составляем систему трех линейных уравнений, которая является необходимым условием минимума функции:


Данная система является системой линейных однородных уравнений. Решая эту систему методом Крамера и зная, что:

составляем определители, состоящие из коэффициентов при  и столбца свободных членов.

 Значения  находим делением соответствующих определителей.

= = =

Докажем теперь, что в точке  функция  имеет минимум. Достаточным условием существования минимума функции трех переменных является следующее неравенство:

d.

 Получаем следующее уравнение:

Воспользуемся критерием Сильвестра, т.е. найдем миноры 1-ого, 2-ого и 3-ого порядков и докажем, что они положительные.

==

Найдем миноры первого, второго и третьего порядков для этого определителя:

Так как все миноры положительны, то по критерию Сильвестра d, и функция  имеет минимум в точке .

Таким образом, парабола  имеет следующий график:


рис.3. График уравнения параболической регрессии

Анализ полученных результатов и вывод о зависимости Xi и Yi

рис.4. Сравнение линейной и параболической регрессий

Для сравнения полученных результатов построения кривых  и  определим значения статистик:

Поскольку  и , можно говорить о том, что зависимость между  и  близка и к линейной, и к квадратичной. При этом парабола  меньше отклоняется от точек  и , чем прямая  


Вывод

Зависимость потребления бензина от количества автомобилей близка к линейной и к квадратичной. Однако видно, что разница между значениями статистик  небольшая. Следовательно, с практической точки зрения удобнее приближать точки выборки  и  к прямой . Выявление зависимости между потреблением бензина и количеством автомобилей пригодится для понимания ситуации, которая складывается у нас на дорогах и влияет на природу, поскольку потребление бензина всегда сопровождается вредными выбросами.


Список литературы

1.  Гмурман В.Е. Теория вероятностей и математическая статистика. — М.: Высшая школа 1998.

2.  Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике — М.: Высшая школа 1998.

3.  Ивашев-Мусатов О. С. Теория вероятностей и математическая статистика — М.: Наука 1979.

4.  Мазный Г.Л., Прогулова Т.Б. Методическое пособие к курсовому проектированию по ВМ и информатике. — Дубна: Кафедра ВМ и САУ, 1996.