Контрольная работа: Метод найменших квадратів
Метод найменших квадратів
У процесі вивчення різних питань природознавства, економіки і техніки, соціології, педагогіки доводиться на основі великої кількості дослідних даних виявляти суттєві фактори, які впливають на досліджуваний об’єкт, а також встановлювати форму зв’язку між різними зв’язаними одна з одною величинами (ознаками).
Нехай у результаті досліджень дістали таку таблицю деякої функціональної залежності:
Таблиця 1
x |
x1 |
x2 |
… |
xn |
y |
y1 |
y2 |
… |
yn |
Треба знайти
аналітичний вигляд функції , яка добре відображала б цю
таблицю дослідних даних. Функцію
можна шукати у вигляді
інтерполяційного поліному. Але інтерполяційні поліноми не завжди добре
відображають характер поведінки таблично заданої функції. До того ж значення
дістають у
результаті експерименту, а вони, як правило, сумнівні. У цьому разі задача
інтерполювання табличної функції втрачає сенс. Тому шукають таку функцію
, значення якої
при
досить
близькі до табличних значень
. Формулу
називають емпіричною, або рівнянням
регресії
на
.
Емпіричні формули мають велике практичне значення, вдало підібрана емпірична
формула дає змогу не тільки апроксимувати сукупність експериментальних даних,
«згладжуючи» значення величини
, а й екстраполювати знайдену
залежність на інші проміжки значень
.
Процес побудови емпіричних формул складається з двох етапів: встановлення загального виду цієї формули і визначення найкращих її параметрів.
Щоб встановити
вигляд емпіричної формули, на площині будують точки з координатами
. Деякі з цих точок
сполучають плавною кривою, яку проводять так, щоб вона проходила якомога ближче
до всіх даних точок. Після цього візуально визначають, графік якої з відомих
нам функцій найкраще підходить до побудованої кривої. Звичайно, намагаються підібрати
найпростіші функції: лінійну, квадратичну, дробово-раціональну, степеневу,
показникову, логарифмічну.
Встановивши вигляд емпіричної формули, треба знайти її параметри (коефіцієнти). Найточніші значення коефіцієнтів емпіричної формули визначають методом найменших квадратів. Цей метод запропонували відомі математики К. Гаусс і А. Лежандр.
Розглянемо суть методу найменших квадратів.
Нехай емпірична формула має вигляд
, (1)
де ,
, …,
- невідомі коефіцієнти.
Треба знайти такі значення коефіцієнтів
, за яких крива (1) якомога ближче
проходитиме до всіх
точок
,
, …,
, знайдених експериментально. Зрозуміло,
що жодна з експериментальних точок не задовольняє точно рівняння (1).
Відхилення від підстановки координат
у рівняння (1) дорівнюватимуть
величинам
.
За методом
найменших квадратів найкращі значення коефіцієнтів ті, для яких сума квадратів
відхилень
(2)
дослідних даних від обчислених
за емпіричною формулою (1) найменша. Звідси випливає, що величина (2), яка є
функцією від коефіцієнтів
, повинна мати мінімум. Необхідна
умов мінімуму функції багатьох змінних ─ її частинні похідні мають
дорівнювати нулю, тобто
,
, …,
.
Диференціюючи
вираз (2) по невідомих параметрах , матимемо відносно них систему
рівнянь:
Система (3) називається нормальною. Якщо вона має розв’язок, то він єдиний, і буде шуканим.
Якщо емпірична
функція (1) лінійна відносно параметрів , то нормальна система (3) буде
системою з
лінійних
рівнянь відносно шуканих параметрів.
Будуючи емпіричні
формули, припускатимемо, що експериментальні дані додатні.
Якщо серед
значень і
є
від’ємні, то завжди можна знайти такі додатні числа
і
, що
і
.
Тому
розв’язування поставленої задачі завжди можна звести до побудови емпіричної
формули для додатних значень .
Побудова
лінійної емпіричної формули. Нехай між даними існує лінійна залежність.
Шукатимемо емпіричну формулу у вигляді
, (4)
де коефіцієнти і
невідомі.
Знайдемо значення
і
, за яких функція
матиме
мінімальне значення. Щоб знайти ці значення, прирівняємо до нуля частинні
похідні функції
Звідси,
врахувавши, що , маємо
(5)
Розв’язавши
відносно і
останню
систему, знайдемо
, (6)
. (7)
Зазначимо, що,
крім графічного, є ще й аналітичний критерій виявлення лінійної залежності між
значеннями і
.
Покладемо ,
,
.
Якщо , то залежність
між
і
лінійна, бо
точки
лежатимуть
на одній прямій. Якщо
, то між
і
існує майже лінійна залежність,
оскільки точки
лежатимуть близько до деякої
прямої.
Побудова
квадратичної емпіричної залежності. Нехай функціональна залежність між та
- квадратична.
Шукатимемо емпіричну формулу у вигляді
. (8)
Тоді формулу (2) запишемо наступним чином
Для знаходження
коефіцієнтів ,
,
, за яких функція
мінімальна, обчислимо
частинні похідні
,
,
і прирівняємо їх до нуля. В
результаті дістанемо систему рівнянь
Після рівносильних перетворень маємо систему
(9)
Розв’язок цієї системи і визначає єдину параболу, яка краще від усіх інших парабол (8) подає на розглядуваному проміжку задану таблично функціональну залежність.
Сформулюємо
аналітичний критерій для квадратичної залежності. Для цього введемо поділені
різниці першого і другого порядку
і , де
.
Точки розміщені на
параболі (8) тоді і тільки тоді, коли всі поділені різниці другого порядку
зберігають сталі значення.
Якщо точки рівновіддалені,
тобто
,
то для існування квадратичної залежності (8) необхідно і достатньо, щоб була
сталою скінчена різниця другого порядку
, причому
.
Побудова
емпіричних формул найпростіших нелінійних залежностей. Нехай у системі координат маємо
нелінійну залежність
, неперервну і монотонну на
відрізку
.
Введемо змінні ,
так, щоб у
новій системі координат
задана емпірична нелінійна
залежність стала лінійною
. (10)
Тоді точки з
координатами в площині
лежатимуть на прямій
лінії.
Покажемо, як від нелінійних залежностей
, 2)
, 3)
,
, 5)
, 6)
перейти до лінійних.
1) Розглянемо
степеневу залежність , де
,
,
.
Логарифмуючи її,
знаходимо .
Звідси, поклавши
,
,
,
, маємо
.
2) Логарифмуючи
показникову залежність , маємо
. Поклавши
,
,
,
в системі координат
дістанемо
залежність (10).
Зазначимо, що
замість показникової залежності часто шукають залежність
. Остання
перетвориться в лінійну, якщо позначити
,
,
,
.
3) Щоб перейти від
логарифмічної залежності до лінійної
, досить зробити
підстановку
,
.
4) У
гіперболічній залежності замінимо змінні ,
. Тоді гіперболічна залежність
перетвориться в лінійну (10), в якій
,
.
5) Розглянемо
дробово-лінійну функцію . Знайдемо обернену функцію
. Тоді ввівши
нові координати
,
, дістанемо лінійну залежність
(10), де
,
.
6) Нехай маємо
дробово-раціональну залежність . Оберненою до неї буде залежність
. Ввівши
нові змінні
,
,
дістанемо лінійну залежність (10) з коефіцієнтами
,
.
Отже, для побудови будь-якої з емпіричних формул 1)-6) треба:
а) за вихідною
таблицею даних побудувати нову таблицю
, використавши
відповідні формули переходу до нових координат;
б) за новою
таблицею даних знайти методом найменших квадратів коефіцієнти і
лінійної функції (10);
в) за
відповідними формулами знайти коефіцієнти і
даної нелінійної залежності.
Вибрати емпіричну
формулу для нелінійних залежностей графічним методом часто буває важко. Тоді
вдаються до перевірки аналітичних критеріїв існування певної залежності. Для цього
зводять її до лінійної і перевіряють виконання критерію лінійної залежності між
перетвореними вихідними даними . Але є й власні аналітичні
критерії наявності кожної з розглянутих вище нелінійних залежностей.
Найпростіші необхідні умови їх наявності подано в табл. 2.
Таблиця 2
№ пор. | Емпірична формула |
|
|
Спосіб вирівнювання |
1 |
|
|
|
|
2 |
|
|
|
|
3 |
|
|
|
|
4 |
|
|
|
|
5 |
|
|
|
|
6 |
|
|
|
|
7 |
|
|
|
|
Умови перевіряють
у такий спосіб. На заданому відрізку зміни
незалежної змінної вибирають дві точки, досить
надійні і розміщені якомога далі одна від одної. Нехай, наприклад, це будуть
точки
,
. Потім, залежно
від типу емпіричної формули, що перевіряється, обчислюють значення
, яке є або
середнім арифметичним, або середнім геометричним, або середнім гармонічним
значень
,
. Маючи
значення
і
аналогічно
обчислюють і відповідне значення
. Далі, користуючись даною
таблицею значень
, для значення
знаходять відповідне
йому значення
. Якщо
немає в таблиці, то
знаходять
наближено з побудованого графіка даної залежності або за допомогою лінійної
інтерполяції
, де
і
─ проміжні значення, між
якими лежить
. Обчисливши
, знаходять величину
. Якщо ця
величина велика, то відповідна емпірична формула не придатна для апроксимації
заданих табличних даних. З кількох придатних емпіричних формул перевагу надають
тій, для якої відхилення
якомога менше.