Реферат: Оптимальність у системах керування

оптимальність у системах керування


1. Умови оптимальності у неавтономних системах керування

У загальному випадку неавтономної системи права частина закону руху й підінтегральна функція цільового функціонала залежать явно від часу , тобто закон руху має вигляд:

, (1)

а цільовий функціонал дорівнює

. (2)

Тут функції  і  – неперервні по сукупності змінних і неперервно диференційовані по змінних , , .

Також вважатимемо, що момент часу , який відповідає початковому стану , відомий, а момент часу  проходження через кінцеву точку  не заданий і повинен бути знайдений, тобто сформульована задача – це задача з вільним часом.

Поставлена задача може бути зведена до автономної задачі введенням додаткової змінної . До закону руху при цьому додається рівняння

,

а до початкових умов – співвідношення .

Тепер систему (2) можна переписати у вигляді:

 (3)

а функціонал  дорівнюватиме

, (4)

де  (відповідно до доданого у початкову систему рівняння).

Отже, неавтономну -вимірну задачу було зведено до автономної задачі з розширеним фазовим простором. У новій задачі потрібно знайти оптимальну траєкторію, що поєднує точку  розширеного фазового простору з деякою точкою  на прямій, яка проходить через точку  паралельно осі . Оскільки кінцеве значення  змінної  невідоме, то нова задача – це задача з фіксованим лівим і рухомим правим кінцями.

Якщо в задачі оптимального керування (3) – (4) відомі і початковий момент часу  й кінцевий момент часу , то задача називається задачею з фіксованим часом. Перетворення цієї задачі введенням додаткового змінного приводить до задачі з фіксованими кінцями в такому формулюванні. Потрібно знайти керування , що переводить фазову точку системи (2) зі стану  в момент часу  у стан  в момент часу , причому функціонал (4) набуває найменшого значення. Зауважимо, що момент часу  попадання в точку  можна не вважати фіксованим, оскільки в силу тотожності  попадання в точку  може відбутися тільки в цей момент часу. Таким чином, до даної задачі можна застосувати теорему, відповідно до якої для одержання необхідних умов екстремуму функціонала необхідно максимізувати функцію Понтрягіна

, (5)

де  – загальний вигляд функції Понтрягіна з теореми 1, у якій не врахована додаткова, ()-ша змінна. Спряжена система для цієї задачі за умов  набуває вигляду:

 (6)

Має місце така теорема.

Припустимо, ,  – оптимальний процес для задачі з фіксованим часом. Тоді існує ненульова вектор-функція , що відповідає цьому процесу, така що:

1. Для будь-якого  функція  змінної  набуває максимального значення в точці , тобто:


: .

2. , .

Оскільки, як і раніше, , то умову 2 цієї теореми достатньо перевірити в якій-небудь одній точці відрізка .

Розглянемо випадок, коли при фіксованому  правий кінець вільний. Ця задача полягає в тому, щоб із заданого стану  за заданий час  пройти по траєкторії з довільним кінцевим станом за умови мінімізації цільового функціонала. Умови трансверсальності для цієї задачі набувають вигляду:

, . (7)

Для цього випадку необхідна умова оптимальності полягає в тому, щоб функція  досягала максимального значення для кожного  на оптимальному керуванні  і мала місце умова (7).

2 Поняття особливого керування

На практиці часто зустрічаються задачі оптимального керування, у яких функція Понтрягіна лінійно залежить від всіх керувань або від частини з них (наприклад, в лінійних задачах оптимальної швидкодії). Однак у нелінійних задачах оптимального керування (якщо функція Понтрягіна є нелінійною по одній або декількох фазових змінних) можлива ситуація, коли на оптимальній траєкторії коефіцієнт при одній з компонент вектора керування  обертається на нуль всюди на деякому інтервалі часу, і тоді умова максимуму функції  за  не дозволяє однозначно визначити оптимальне керування. Ця ситуація називається особливим режимом керування. Дослідимо її детальніше.

Розглянемо автономну задачу оптимального керування

,

Де ; , , , ,

 – довільна множина з ;

 – лінійний простір кусково-неперервних на  функцій.

Крайові умови задачі мають вигляд:

, .

Потрібно знайти таке припустиме керування , що переводить систему зі стану  у стан , причому відповідний припустимий процес  доставляє мінімальне значення функціоналу

,

де функції ,  неперервні по сукупності всіх змінних і неперервно-диференційовані по змінних .

Вважатимемо, що функція Понтрягіна  для цієї задачі є лінійною за частиною компонент вектора . Виділимо із цих компонент групу з  керувань (з тих, за якими функція  лінійна) і позначимо їх через , а інші  керувань зберемо у вектор  (він також може включати компоненти, за якими функція  лінійна). За таких умов закон руху набуває вигляду:

,

де .

Складемо функцію Понтрягіна для даної задачі:

.

Очевидно, що

, . (8)

Припустимо, що процес  разом з розв’язком  спряженої системи

, , (9)

задовольняє принципу максимуму і, крім того, припустимо, що у всіх точках деякого інтервалу  має місце рівність

, (10)


або, враховуючи (10),

, , . (11)

Ця ситуація означає, що коефіцієнти при  на деякому часовому відрізку дорівнюють 0, і оптимальне керування визначити неможливо. У цьому випадку вектор керувань  називається особливим керуванням на відрізку , процес  – особливим режимом, траєкторія  – траєкторією особливого режиму, а відрізок часу  – ділянкою особливого керування.

З формули (11) випливає, що на ділянці особливого режиму функція Понтрягіна не залежить від . Дійсно, :

.

Тому в даній ситуації умова максимуму по  не дає жодної інформації про конкретні значення керувань .

Оскільки на ділянці особливого режиму має місце співвідношення (11), то очевидно, що

,

і т.д. Останні співвідношення разом з умовою (10) дозволяють визначити всі особливі режими.


3. Лінійна задача оптимальної швидкодії

Розглянемо лінійну задачу оптимальної швидкодії:

, , (12)

де , ,

,  – числові матриці розмірності  та  відповідно.

Область керування задачі  – замкнутий обмежений багатогранник в :

, , (13)

Якщо для будь-якого вектора , паралельного будь-якому ребру багатогранника , система векторів , , …,  (14) є лінійно незалежною, то багатогранник  задовольняє умові спільності положення відносно системи (14).

Для перевірки лінійної незалежності векторів (13) достатньо перевірити, чи матриця, стовпцями якої є стовпці (12), є невиродженою, тобто

.


Перепишемо формулу (10):

, ,

де ,  – -і рядки матриць  і .

Функція Понтрягіна лінійної задачі оптимальної швидкодії має вигляд:

 (15)

Оскільки перший доданок у формулі (15) не залежить від , то функція  досягає максимуму за змінною  одночасно з функцією

.

Спряжена система у цьому випадку може бути записана у вигляді:

, ,

або у векторній формі

. (16)


Позначимо через . З теореми 2 випливає, що якщо  – оптимальне керування, то існує такий ненульовий розв’язок  системи (16), для якого в кожний момент часу функція  набуватиме максимального значення за змінною :

. (17)

Оскільки система (17) з постійними коефіцієнтами не містить невідомих функцій  і , то всі її розв’язки можна легко знайти, після чого, використовуючи їх для розв’язання задачі максимізації функції  на множині , знаходимо оптимальні керування .

Для будь-якого нетривіального розв’язання  системи (11) співвідношення (14) однозначно визначає керування , причому це керування кусково стале, а значеннями керування в точках неперервності є вершини багатогранника .

Точки розриву оптимальної функції керування  відповідають зміні значення керування і називаються точками перемикання. Якщо  – точка перемикання, то ліворуч від неї керування має одне значення, наприклад, , а праворуч інше – .

Позначимо через  підмножину у  виду

. (18)

Якщо всі корені характеристичного рівняння матриці  з (14) є дійсними, то для будь-якого розв’язання  рівняння (18) кожна з функцій  є кусково сталою і має не більше ніж  перемикань ( – порядок системи (16)).

Керування  називається екстремальним керуванням, якщо воно задовольняє принципу максимуму.

Для лінійної задачі оптимальної швидкодії з областю керування – багатогранником  керування  є екстремальним, якщо існує таке нетривіальне розв’язання  системи (17), для якого матиме місце співвідношення (18).

Зрозуміло, що будь-яке оптимальне керування є екстремальним. Тому, щоб знайти оптимальне керування, що переводить фазову точку зі стану  у стан , треба відшукати всі екстремальні керування з цими крайовими умовами, а потім серед них вибрати те, що здійснює перехід за найменший час.

У загальному випадку можуть існувати кілька оптимальних керувань, що переводять фазову точку зі стану  у стан , але якщо початок координат у просторі керувань є внутрішньою точкою багатогранника , то екстремальне керування єдине. Отже, у лінійних задачах оптимальної швидкодії принцип максимуму дозволяє не тільки визначити вид оптимальних керувань, але й одержати умови єдиності оптимального керування.

Припустимо, що початок координат є внутрішньою точкою багатогранника  припустимих керувань. Якщо  і  – два екстремальних керування, що переводять фазову точку зі стану  у стан  за час  і  відповідно, то  і , .

У теоремі має місце умова .

Теорема. Якщо існує хоча б одне керування, що переводить систему (17) зі стану  у стан , то існує й оптимальне по швидкодії керування, що також переводить систему з  у .

4. Умови оптимальності у задачі з рухомими кінцями

 

У задачі з рухомими кінцями або початковий стан , або кінцевий стан , або обидва ці стани невідомі. Задані тільки множини  і , що містять точки  та .

Гіперповерхня – це множина всіх точок , які задовольняють співвідношенню

,

де  – скалярна диференційована функція. Якщо  – лінійна функція, то гіперповерхня називається гіперплощиною і описується рівнянням

. (19)

Якщо , то гіперплощина (19) є ()-вимірним лінійним підпростором в .

Будь-який ()-вимірний підпростір  може бути заданий як множина розв’язань лінійної однорідної системи з  рівнянь із  невідомими, матриця якої має ранг :


 .

Такий лінійний підпростір називається -вимірною площиною. Множина розв’язань системи нелінійних рівнянь

де функції , …,  диференційовані і ранг матриці Якобі цієї системи функцій дорівнює , є -вимірним гладким різноманіттям.

Задача оптимального керування з рухомими кінцями полягає в тому, щоб знайти таке припустиме керування  для системи із законом руху

, , ,

яке переводить фазову точку з деякого, заздалегідь невідомого, стану  на -вимірному різноманітті  () у деякий стан  на -вимірному різноманітті  () і надає найменшого значення функціоналу


.

Задача оптимального керування з фіксованими кінцями є окремим випадком цієї задачі при , тобто коли різноманіття  і  вироджуються в точку.

Відсутність рівнянь, що задають початковий і кінцевий стани, приводить до того, що система необхідних умов перестає бути повною. У цьому разі для одержання відсутніх рівнянь використовують умови, що називаються умовами трансверсальності.

Умови трансверсальності. Вектор спряжених змінних  із принципу максимуму задовольняє умові трансверсальності на лівому кінці траєкторії , якщо вектор  ортогональний дотичній площини до різноманіття  в точці , тобто

, (20)

де  – довільний вектор, що лежить у дотичній площини. Аналогічно формулюється умова на правому кінці.

Якщо ,  – оптимальний процес у задачі з рухомими кінцями , , то ненульова вектор-функція , що існує відповідно до теореми 3, задовольняє на кожному з кінців траєкторії умовам трансверсальності.

Розглянемо окремий випадок задачі з рухомими кінцями, коли, наприклад, правий кінець траєкторії вільний (тобто ). Тоді умови трансверсальності зводяться до співвідношення . Повний вектор спряжених змінних

визначається з точністю до довільної сталої, зокрема, вважають, що  (відповідно до принципу максимуму , ) і тоді

.