Предикатне керування

НМ2

НМ

 

r

 

 

Рис. 5.2. Схема попереднього інверсного навчання

 


 

Розглянемо схему на рис. 5.3. Нейроемулятор НМ2 навчається зворотній динаміці ОК, а нейроконтролер НМ1 просто копіює свої параметри з НМ2.

X НМ1 u ОК y

 

e

 

 

 

Параметри

 

 

Рис. 5.3. Схема оперативного навчання ШНМ зворотній динаміці

 

Тут використовується розімкнена схема керування без від’ємного зворотного зв’язку. Перевагами такої схеми є, зазвичай, простота і стійкість. До недоліків можна віднести таке:

 

– за виконання умови квазістаціонарності ОК дана схема не гарантує, що вихідний сигнал ОК буде відповідати опорному сигналові;

– схема не здатна керувати нестійким об’єктом;

 

– труднощі виникають, якщо динаміка ОК не має зворотної.

 

 

Концепція предикатного керування побудована на керуванні з передбаченням. Рис. 5.4 ілюструє процедуру спеціалізованого навчання ШНМ для послідовної схеми керування.

 

У цьому разі ШНМ навчається так, щоб отримати найкраще ви-конання рівності y = x.

 


 

 

Слід зазначити, що у цьому разі для навчання ШНМ не можна за-стосовувати класичного методу зворотного поширення похибки, оскільки між виходом системи і ШНМ стоїть ОК, якобіан якого в загальному випадку невідомий, і доводиться застосовувати або числову апроксимацію якобіана системи, або інші модернізації методу зворотного поширення, що не потребують інформації про якобіан системи.

 

Також для цього випадку може застосовуватися навчання ШНМ за допомогою генетичних алгоритмів. Крім цього, система, зображена на рис. 5.4, не може навчатися в оперативному режимі.

 

Інший підхід полягає у тому, щоб у систему (рис. 5.4) додати ще одну ШНМ (емулятор), який виконує імітаційне моделювання ОК

 

(рис. 5.5).

 

 

На рис. 5.5 НМ1 виконує функції контролера, а НМ2 – емулятора. При цьому нейроемулятор НМ2 може використовуватись як для визначення якобіана ОК, так і для навчання нейроконтролера НМ1. У цьому випадку ідентифікатор НМ2 настроюється на пряму динаміку об’єкта, а НМ1 настроюється через ідентифікатор НМ2 так, щоб оптимізувати критерій якості керування на визначеному інтервалі часу. Після реалізації керування на даному інтервалі часу процес повторюється. Цей метод також називають «зворотне поширення у часі» або «принцип горизонту, що віддаляється».

 

Керування з передбаченням, порівняно з інверсійним керуванням, дає кращі результати. Особливо це проявляється у випадку нереалізовності точної зворотної динаміки об’єкта. Разом з тим і обчислювальні витрати для цього методу значно вищі. Розглядувана схема керування, як і попередня, належить до розімкнутих, і за невиконання умови квазістаціонарності об’єкта вона не гарантує, що вихідний сигнал ОК буде відповідати опорному сигналові.