| Sportkidschannel;pdf

2482
УДК 62-50; 517.977.5; 681.501
МЕТОД АППРОКСИМАЦИОННОЙ
КОРРЕКЦИИ УПРАВЛЯЕМЫХ СИСТЕМ
НА ОСНОВЕ ФОРМАЛИЗМА
ЛИНЕЙНО-КВАДРАТИЧНОЙ
ОПТИМИЗАЦИИ
А.Б. Филимонов
МГТУ - МИРЭА
Россия, 119454, Москва, Проспект Вернадского, д. 78
E-mail: [email protected]
Н.Б. Филимонов
МГУ им. М.В. Ломоносова
Россия, 119991, Москва, Ленинские горы, д. 1
E-mail: [email protected]
Ключевые слова: синтез систем управления, качество управления, динамическая коррекция, эталонная модель, линейно-квадратичная оптимизация, редукция задачи регулирования, развязка каналов управления
Аннотация: Авторами разрабатывается методология аппроксимационной коррекции
управляемых динамических систем. Желаемый результат коррекции задается эталонной
моделью. В предлагаемых схемах динамической коррекции применяется формализм линейно-квадратичной оптимизации, в котором оптимизируемые интегральные квадратичные критерии служат мерой отклонения переходных характеристик скорректированного
объекта от их эталонных значений. Посредством предложенных схем коррекции решаются две задачи: задача синтеза систем регулирования с заданными прямыми показателями качества, а также задача динамической развязки каналов управления в многосвязных системах.
1. Введение
Проблема качества процессов управления, несмотря на давнюю историю развития,
до сих пор остается важнейшей в теории и практике автоматических систем. Однако, в
исследованиях последних десятилетий в известной мере утрачена преемственность с
интуитивно ясными и технически содержательными классическими представлениями о
качестве процессов управления, выработанными отечественной школой автоматики [1].
В то же время в современной теории управления весомую роль играет методология
линейно-квадратичной (ЛК) оптимизации процессов регулирования, которую в отечественных научных кругах также именуют аналитическим конструированием оптимальных регуляторов (АКОР). В классической постановке ЛК-задач стабилизации критерий качества процессов управления задается в виде интегральной квадратичной
формы от координат состояния и управляющих переменных объекта.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2483
Надо признать ряд достоинств методологии и технологии ЛК-оптимизации процессов управления: простота формализации задач, законченность, аналитичность и вычислительная эффективность получаемых решений. Однако, несмотря на это методология ЛК-оптимизации процессов управления справедливо подвергалась критике со стороны ряда ведущих отечественных и зарубежные ученых [2], включая ее основоположников  Калмана (R.E. Kalman) и А.М. Летова. Так, еще Беллман (R.E. Bellman) достаточно аргументировано утверждал, что «для многих задач вопросы оптимальности совсем не существенны. Это просто математический инструмент, который помогает нам
формализовать слово «можно». При этом он отмечал, что введение интегрального
квадратичного критерия  «вопрос математического удобства и часто диктуется желанием применить для решения задачи аналитические методы и получить решение в явном виде», а, касаясь задачи АКОР, особо подчеркивал, что данной «менее важной задачей» часто заменяют исходную, «более реалистичную задачу» оптимизации.
Одно из активно развиваемых в настоящее время направлений в области ЛКсинтеза систем автоматического управления (САУ) состоит в применении экзогенных
(внешних) эталонных моделей динамики замкнутой системы, причем здесь интегральный квадратичный критерий применяется в качестве меры невязки (рассогласования)
действительного и желаемого (эталонного) переходных процессов в системе, а ЛКоптимизация направлена на обеспечение их максимальной близости (см., например, [3,
с. 379-382; 4, с. 483-484; 5, с. 240-242; 6, с. 704-705]).
В настоящей работе обсуждается новый аспект применения формализма ЛКоптимизации – аппроксимационная коррекция управляемых систем [7-10]. Предлагаемые схемы коррекции включают эндогенную (внутреннюю) эталонную модель желаемой динамики скорректированной системы. Задача коррекции решается посредством
формализма ЛК-задач, причем оптимизируемые интегральные квадратичные функционалы служат мерой отклонения переходных характеристик формируемых каналов регулирования от эталонных значений.
Важно подчеркнуть, что развиваемая авторами методология аппроксимационной
коррекции на базе формализма ЛК-оптимизации демонстрирует возможность конвергенции классической концепции прямых показателей качества процессов регулирования и методологии АКОР.
2. Назначение аппроксимационной коррекции
Один из действенных способов решения задач управления заключается в их декомпозиции на две подзадачи: предварительной динамической коррекции объекта и формирования закона управления для скорректированного объекта. Данную идею воплощает блок-схема САУ, представленная на рис. 1. Здесь управляющее устройство (УУ)
состоит из двух блоков: блока коррекции (БК), исправляющего динамику объекта в соответствии с заданной эталонной динамической моделью, и блока управления (БУ),
реализующего закон управления для скорректированного объекта.
Далее рассматривается класс линейных стационарных динамических объектов,
описываемых в переменных состояния уравнениями вида
x  A 0 x  B 0 u ,
(1)
(2)
y  C0 x ,
где t  0 , uR r – вход, xR n – состояние, y R m – управляемый выход, A 0 R nn ,
B 0 R nr , C 0 R mn .
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2484
Далее будем полагать 1  m  r .
Передаточная матрица объекта по каналу «вход-выход» равна
W0 ( s )  C 0 (E n s  A 0 ) 1 B 0 ,
где s – комплексная частота, E n – единичная матрица n-го порядка.
Рис. 1.
Назначение САУ – отработка уставки y  (t ) :
y (t )  y  (t ) ,
в соответствии с заданными требованиями качества процессов управления.
Действие БК будем оценивать по реакции скорректированного объекта на тестовый
сигнал
(3)
v(t )  v(0)  0 (t  0) .
Удобно считать, что данный сигнал генерируется задатчиком, который описывается дифференциальным уравнением
v  0 .
Желаемую динамику выхода скорректированного объекта зададим эталонной моделью (ЭМ):
x M  A M x M  B M v ,
(4)
y M  CM x M  DM v .
(5)
Порядок модели равен nM . Здесь x M R nM – состояние, y M R m – выход эталонной модели; A M , B M , CM , DM – числовые матрицы соответствующих размеров.
Полагаем, что ЭМ устойчива, так что реакция выхода на постоянное входное воздействие (3) устанавливается на постоянном уровне, т.е.
lim y M (t )  0 .
t 
Здесь и далее линейная стационарная система называется устойчивой, если ее
спектр (т.е. множество корней характеристического уравнения) лежит в левой полуплоскости Re s  0 .
Расхождение между выходом скорректированного объекта и выходом эталонной
модели выражает невязка
y (t )  y (t )  y M (t ) .
Динамическая коррекция объекта должна обеспечивать требование:
(6)
y (t )  0 .
Введем малый положительный параметр γ :
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2485
0  γ 1 .
Точность приближения (6) будем оценивать следующим интегральным квадратичным критерием (двойные прямые скобки || ... || обозначают евклидову норму вектора):
(7)

(8)
J у   e  2 t || y (t ) ||2 dt ,
0
а интенсивность управляющих воздействий – критерием
(9)
J u

  e  2 t || u(t ) ||2 dt .
0
Отметим роль весового множителя e 2 t в функционалах (8) и (9) – он обеспечивает их сходимость для класса ограниченных функций и тем самым позволяет рассматривать установившиеся режимы в САУ с ненулевой асимптотикой процессов y (t ) и u(t ) .
Задачу синтеза БК можно формализовать посредством ограничения или минимизации критериев (8), (9). В наиболее общей постановке это будет задача двухкритериальной оптимизации, которая сводится к базовой задаче оптимизации с обобщенным критерием оптимальности, образованным сверткой данных частных критериев ( g  0 ):
J   gJ y  J u  min ,
или то же самое, но с учетом (8), (9):
(10)
J 

e
 2 t
( g || y (t ) ||2  || u(t ) ||2 ) dt  min .
0
Оптимизационный аспект структурно-параметрического синтеза БК показывает,
что рассматриваемый тип динамической коррекции объекта по своему смыслу является
аппроксимационным.
3. Структура блока коррекции
Предлагаемую структуру БК отражает рис. 2.
Рис. 2.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2486
Функционирование БК подчиняется уравнениям
u   (K 1 x  K 2 x M  K 3 v ) ,
(11)
x M  A M x M  B M v .
(12)
Здесь K1 R r  n , K 2  R r  nM , K 3 R r m – матричные настроечные параметры БК;
парой ( A M , B M ) обозначено звено, реализующее уравнение состояния (4) ЭМ.
Задача синтеза БК сводится к нахождению закона управления (11), оптимального в
смысле критерия (10).
4. Эквивалентная стационарная ЛК-задача
Рассмотрим систему S :
x  A 0 x  B 0u ,
(13)
x M  A M x M  B M v ,
(14)
(15)
v  0 ,
y  C 0 x  C M x M  D M v .
(16)
Она описывает динамику состояний объекта и эталонной модели, формирование
сигналов v (t ) и y (t ) . Порядок системы равен
N  n  nM  m .
Сформируем вектор состояния системы S :
x 
z  x M  .
(17)
v 
 
Тогда уравнения (13)(16) можно записать в более компактной форме:
z  Az  Bu ,
(18)
(19)
y  Cz .
В соответствии с (17) матрицы A , B , C имеют блочную структуру (нулевые блоки оставлены пустыми), представленную следующими выражениями:
 A0
 B0 



 , C C
 CM  DM  .
A
A M B M  , B  
0





Закон управления (11) представим в виде
u   Kz ,
(20)
где в соответствии с (17) K – блочная матрица:
K  [ K1 K 2 K 3 ] .
(21)
Из (19) следует равенство
g || y ||2  z T Qz ,
(22)
где Q – симметрическая неотрицательно определенная матрица:
Q  g C TC
(23)
(символ Т – обозначает операцию транспонирования матрицы).
Используя (22), преобразуем критерий (10) к виду

(24)
J    e 2 t (z T (t )Qz (t )  || u(t ) || 2 )dt  min .
0
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2487

Рассмотрим вспомогательную систему S :



(25)
x  ( A 0  E n ) x  B 0 u ,



(26)
x M  ( A M  E nM ) x M  B M v ,


v   v ,
(27)




где xR n , x M R nM , vR m , uR r – управляющий вход.

Вводя состояние системы S :

x 
 
z  x M  ,
 v 
 
из (25)(27) получим ee уравнения состояния
 

(28)
z  Az  Bu ,
причем

(29)
A  A  E N .
Данное равенство вытекает из сравнения уравнений (13)(15) с (25)(27).

Из (29) следует, что спектр системы S получается сдвигом спектра системы S
влево на малую величину (7).

Установим связь между динамическими процессами в системах S и S .

Предложение 1. Система S приводится к системе S посредством следующей замены переменных:


z (t )  e t z (t ) , u(t )  e t u(t ) .
(30)
Действительно, прямая подстановка данных соотношений в (18) с учетом (29) дает (28).
Таким образом, соотношения (30) устанавливают взаимно однозначное соответст
вие между управляемыми движениями систем S и S .
Подстановка выражений (30) в критерий (24) приводит к оптимизационной задаче

для системы S :

(31)



J 0   (z T (t )Qz (t )  || u(t ) ||2 ) dt  min .
0
Отсюда вытекает следующее предложение.
Предложение 2. Исходная задача ЛК-оптимизации процессов управления (24) в
системе S эквивалентна стационарной задаче ЛК-оптимального управления системой

S по критерию (31).
Наконец, необходимо ответить на вопрос разрешимости решаемой задачи оптимизации.
Прежде всего, отметим, что закон управления (20) для системы S с помощью со
отношений (30) преобразуется в закон управления для системы S :


u   Kz .
(32)
Предложение 3. Если объект (1), (2) является вполне управляемым, эталонная модель (4), (5) – устойчива, то оптимизационная задача (10) разрешима.
Обоснуем данное предложение. В силу предложения 2 вопрос разрешимости оптимизационной задачи (18), (24) сводится к вопросу разрешимости задачи (28), (31). За
метим, что системы S состоит из трех подсистем, представленных уравнениями
(25)(27). Пусть выполняются допущения последнего предложения. Из полной управ
ляемости объекта следует, что подсистема (25) в S также вполне управляема. ПодсисXII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2488
темы (26), (27) хотя и неуправляемы, но являются устойчивыми. Таким образом, систе
ма S стабилизируема, т.е. посредством действия стабилизирующих обратных связей
возможно добиться ее устойчивости (в замкнутом состоянии). Но в этом случае функционал в (31) будет принимать конечные значения, что в итоге гарантирует существование оптимума (10).
Замечание. Приведем еще одно соображение в пользу излагаемого подхода к формализации задачи динамической коррекции – применении критериев качества (8), (9) с
параметризацией (7) и последующем сведении исходной оптимизационной задачи к эквивалентной стационарной ЛК-задаче.
Пусть время установления переходных процессов в скорректированном объекте не

превышает величины T , причем T 1 . Сравним движения систем S и S , полагая,
что их начальные состояния совпадают:

z ( 0)  z ( 0) .
Сравнение уравнений (13)(15) и (25)(27) показывает, что управляемые динами
ческие процессы в системах S и S практически не будут отличаться на временном ин
тервале 0  t  T . В частности, согласно (27) сигнал v (t ) является экспоненциальным


v(t )  v(0) exp( γ t ) ,
но в силу (7) это – слабозатухающий (т.е. квазистационарный) сигнал, который практически совпадает с постоянным сигналом (3) при 0  t  T .
5. Расчет параметров блока коррекции
Решение стационарной ЛК-задачи (28), (31) дает линейный закон управления (32) с
матрицей K вида
K  BT P ,
где PR N  N – симметрическая матрица, являющаяся решением алгебраического матричного уравнения Риккати
 
PBB T P  PA  A T P  Q  0 .
Разбивая полученную матрицу K согласно (21) на блоки размеров r  n , r  nM и
r  m , находим искомые матричные параметры K1 , K 2 и K 3 БК (11), (12).
Необходимая настройка БК осуществляется посредством подходящего выбора весового коэффициента g в структуре весовой матрицы (23).
Предложение 3. Пусть объект (1), (2) является вполне управляемым, а эталонная
модель (4), (5) устойчива. Тогда посредством выбора больших значений весового коэффициента g : g  1 , отклик y (t ) возможно сделать сколь угодно малым в смысле
метрики функционального пространства L2 [0, ) :

J y   e  2 t || y (t ) ||2 dt   y ,
0
где  y – априори заданная малая положительная величина.
Данное предложение имеет принципиальное значение, поскольку гарантирует возможность эффективной настройки БК.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2489
6. Редукция задач регулирования на основе схем
аппроксимационной коррекции
Построение САУ по схеме динамической коррекции каналов управления (рис. 1)
позволяет упростить задачу регулирования – она решается применительно к эталонной
модели скорректированного объекта. Если же динамический порядок эталонной модели меньше порядка модели, т.е. n M  n , то динамическая коррекция объекта порождает
еще один благоприятный эффект – снижение размерности задачи регулирования.
Пример 1. Параметры объекта: n  3 , m  r  1 ;
1
0
0
0 


A 0  0  0,5 1  , B 0  0 , C0  1,5 0 0 .
0
1
0
 1
Его передаточная функция
3
.
s ( s 1)(2s  1)
Примем следующую эталонную модель динамики скорректированного объекта:
1
WM ( s ) 
.
s 1
W0 ( s )  C 0 (E n s  A 0 ) 1 B 0 
Результат расчета БК для   0,001 и g  104 :
K 1  [150,00 51,57 9,20] , K 2   68,69 , K 3   30,30 .
Рис. 3 иллюстрирует результат динамической коррекции. На нем представлены переходные характеристики скорректированного объекта и эталонной модели, т.е. их реакции y (t ) и y M (t ) на единичную ступеньку: v 1(t ) . Видно, что фактическая переходная характеристика близка к эталонной.
Рис. 3.
В БУ реализуем ПИ-закон управления с передаточной функцией:
k
WR (s)  k P  I .
s
Выберем следующую настройку регулятора: k P  0,6 ; k I 1 . В этом случае эталонной передаточной функции скорректированного объекта отвечает передаточная функция замкнутой системы
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2490
0,6s  1
s  1,6 s  1
с полюсами, равными  0,8  0,6 i .
На рис. 4 представлены фактическая (сплошная линия) и эталонная (пунктир) переходные характеристики САУ, т.е. реакции y (t ) и yˆ (t ) на единичную ступеньку:
Wˆ ( s ) 
2
y  1(t ) , а также разница между ними y (t ) .
Рис. 4.
Таким образом, фактическая переходная характеристика замкнутой системы близка
к эталонной. Заметим, что спектр синтезированной САУ
  {  0,8243  0,6124 i;  2,1746  4,4937 i;  5,7070 } ,
т.е. доминирующие полюса замкнутой системы блики к полюсам желаемой передаточной функции Wˆ ( s ) .
7. Динамическая развязка каналов управления
Многосвязные САУ имеет несколько контуров управления и для многих инженерных приложений актуальной является задача их автономизации, т.е. достижение автономности (независимости) процессов управления в различных контурах посредством
системотехнических методов и средств. Решение данной задачи возможно основывать
на механизме динамической развязки: формировании новых несвязанных или же слабо
связанных каналов управления, на которые и будут замыкаться синтезируемые контуры
автономного управления.
Динамическую развязку, в свою очередь, правомерно рассматривать как особый
тип динамической коррекции многоканальных объектов – достаточно выбрать подходящую эталонную моделью с сепаратными каналами управления.
Передаточная матрица ЭМ по каналам «вход-выход» в соответствии с уравнениями
(4) и (5) равна
G ( s )  C M (E nM s  A M ) 1 B M  D M .
Варианту одномерных сепаратных каналов отвечает диагональная передаточная
матрица:
G ( s )  diag(G1 ( s ), G2 ( s ),..., Gm ( s )) ,
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2491
где Gi (s ) – передаточные функции сепаратных каналов. В случае «квадратного» объекта, т.е. при r  m , входами сепаратных каналов являются переменные  i , i  1, m .
Пример 2. Параметры объекта: n  4 , r  m  2 ;
1
0
0
 0 2
0

 0 1
1  2  2
1
1
 ; C0  2  1 0

A0 
; B0  
.

  1 2
0  2  3
0 0  1
1
0




1
1  2
 0 1
0
Эталонную модель зададим диагональной передаточной матрицей
 1
1 
 .
G ( s )  diag 
,
 s 1 2 s 1 
Ей отвечают следующие коэффициентные матрицы в уравнениях (4), (5):
0 
1 0 
1 0
 1
AM  
, BM  
, CM  

.

0 0,5
0 1 
 0  0,5
Для получения желаемой статики в скорректированном объекте в каналы управления включим интеграторы, которые опишем уравнениями
x5  u1 и x6  u 2 ,
где x5 и x6 – выходы интеграторов, u1 , u 2 – их входы.
В итоге мы получим расширение состава переменных состояния объекта и соответствующее изменение его коэффициентных матриц.
При расчете БК примем   0,01 и g  100 . В результате получим
0,94  1,05  1,16
1,41  0,33
 0,61
K1  
;
9,72
18,75  2,47 2,58 7,13  0,33
 0,34  5,79
 0,46  4,13
K2 
; K3  
.

0,33
  2,06
 7,93 0,89 
На рис. 5 и 6 представлены переходные характеристики соответственно ЭМ и
скорректированного объекта по всем четырем скалярным каналам «вход-выход» (на
графиках пары (i, j ) обозначают каналы, связывающие i -й вход объекта с его j -м выходом).
Рис. 5.
Рис. 6.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
2492
Видно, что переходные характеристики скорректированного объекта мало отличаются от эталонных значений, т.е. достигнутая развязка каналов управления близка к
идеальной.
Вычисление спектра полюсов скорректированного объекта дает:
  {0,5;  1,0;  1,47;  4,54  5,12 i;  0,61  0,73 i;  6,35}
Отметим, что здесь первые два полюса являются доминирующими и совпадают с полюсами эталонной передаточной матрицы G ( s) .
Отметим также, что эффективность описанной схемы динамической развязки подтверждают также и другие модельные примеры.
Список литературы
1.
Солодовников В.В., Филимонов Н.Б. Динамическое качество систем автоматического регулирования. М.: МВТУ им. Н.Э. Баумана, 1987.
2. Филимонов Н.Б. Проблема качества процессов управления: смена оптимизационной парадигмы //
Мехатроника, автоматизация, управление. 2010. № 12. С. 2-11.
3. Справочник по теории автоматического управления / Под ред. А.А. Красовского. М.: Наука, 1987.
4. Машиностроение. Энциклопедия в 40 тт. Т. I-4. Автоматическое управление. Теория / Е.А. Федосов,
А.А. Красовский, Е.П. Попов и др. Под общ. ред. Е.А. Федосова. М.: Машиностроение, 2000.
5. Современная прикладная теория управления. В 3-х чч. Ч. I. Оптимизационный подход в теории
управления / Под ред. А.А. Колесникова. Таганрог: Изд-во ТРТУ, 2000.
6. Методы классической и современной теории автоматического управления. В 5-ти тт. Т. 4. Теория
оптимизации систем автоматического управления / Под ред. К.А. Пупкова и Н.Д. Егупова. М.: Издво МГТУ им. Н.Э. Баумана, 2004.
7. Филимонов А.Б., Филимонов Н.Б. Динамическая коррекция процессов регулирования методом линейно-квадратичной оптимизации // Мехатроника, автоматизация, управление. 2011. № 5. С. 9-14.
8. Филимонов А.Б., Филимонов Н.Б. Аппроксимационная формализация обратных задач динамики в
процессах управления // Проблемы управления и моделирования в сложных системах: Труды ХIV
Международной конференции. Самара: Самарский НЦ РАН, 2012. С. 546-549.
9. Филимонов А.Б., Филимонов Н.Б. Метод динамической развязки каналов управления на основе
формализма линейно-квадратичной оптимизации // Материалы конференции «Управление в технических,
эргатических,
организационных
и
сетевых
системах»
СПб.:
ГНЦ РФ ОАО «Концерн «ЦНИИ «Электроприбор», 2012. С. 827-830.
10. Филимонов А.Б., Филимонов Н.Б. Метод динамической коррекции и автономизации каналов управления в многосвязных системах на основе формализма линейно-квадратичной оптимизации // Мехатроника, автоматизация, управление. 2012. № 12. С. 2-6.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.