close

Вход

Забыли?

вход по аккаунту

...для оплаты страхового взноса по продукту «ВСЁ И СРАЗУ»;pdf

код для вставкиСкачать
757
УДК 519.362.50
КВАЗИЛИНЕАРИЗАЦИЯ И
ДОСТАТОЧНЫЕ УСЛОВИЯ
ОПТИМАЛЬНОСТИ В ЗАДАЧЕ
УЛУЧШЕНИЯ И ЛОКАЛИЗАЦИИ
В.Н. Сизых
Иркутский государственный университет путей сообщения
Россия, 664074, Иркутск, ул. Чернышевского, 15
E-mail: [email protected]
Ключевые слова: непрерывная динамическая система, управление, приближеннооптимальный синтез, квазилинеаризация, динамическое программирование, метод продолжения по параметру.
Аннотация. Изложен системный подход к аналитическому конструированию параметрически самоорганизующихся, линейных и нелинейных интегрированных систем автоматического управления (САУ) реального (ускоренного) масштаба времени, основанный
на совместном использовании технологий динамического программирования, методов
квазилинеаризации и продолжения по параметру. Для непрерывных динамических систем приведены основы теории нелинейного синтеза в вырожденной (синергетической)
формулировке.
1. Введение
Подход к проблеме синтеза обыкновенных динамических систем, ориентированный на принцип оптимального управления (ОУ) в реальном (ускоренном) времени, был
предложен в начале 1970-х годов В.С. Шендриком (по инициативе Б.Н. Петрова) и развит А.А. Красовским и его учениками [1]. Наибольший вклад в развитие данного направления теории ОУ внес В.Н. Буков [2]. В начале 1990-х принцип управления в реальном времени был «переоткрыт» Р. Габасовым и Ф.М. Кирилловой и успешно развивается в белорусской школе математиков [3].
Известно, что на традиционные алгоритмы последовательных улучшений накладываются достаточно жесткие условия по сходимости и выбору начальных приближений.
На пути использования только достаточных условий оптимальности или теории квазилинеаризации простых и надежных (гарантирующих поточечную сходимость) методов,
как отмечалось еще Р. Беллманом [4], создать не удалось. Для преодоления этих трудностей в работе [5] приведена двухметодная технология, основанная на сочетании метода квазилинеаризации с достаточными условиями оптимальности Беллмана – Кротова. Предлагается применить квазилинеаризацию для локальной оптимизации в окрестности точек стационарности, а достаточные условия оптимальности для интервальной
оптимизации. Основная идея двухметодной технологии: за счет интервальной оптимизации осуществлять грубый поиск начального приближения по достаточным условиям,
а затем итерационным путем уточнять полученное приближение по условиям локальной оптимальности: стационарности или в форме принципа минимума.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
758
Использование для непрерывных динамических систем процедур квазилинеаризации и достаточных условий оптимальности на текущих временных интервалах позволяет выделить четыре базовых схемы решения двухточечных краевых задач (ДТКЗ) [5]:
1) схема традиционного ДП (R. Bellman); 2) схема дифференциального ДП (D.H. Jacobson, В.Ф. Кротов); 3) схема приближений в пространстве политик (дискретный аналог:
R. Bellman, R. Calaba); 4) аналог вариационной схемы.
В докладе через продолжение решений исходной оптимизационной задачи по непрерывному ограниченному параметру обобщается подход, основанный на сочетании
идеи квазилинеаризации с достаточными условиями оптимальности Беллмана – Кротова. Суть такого обобщения состоит в том, что сначала через достаточные условия оптимальности осуществляется грубый поиск начального приближения оптимального
решения, а затем итерационным путем полученное решение раздельно уточняется через его продолжение по нечетко заданному параметру и по условиям локальной оптимальности.
Для организации минимизирующих последовательностей слабой, сильной и абсолютной минималей формулируется вспомогательная (вырожденная по формулировке)
задача приближенно-оптимального синтеза. Вырожденность здесь заложена в саму постановку проблемы управления и проявляется особым образом: исходная (невырожденная) задача синтеза доопределяется до сингулярной с целью включения предельных
функций состояния и/ или управления в множество допустимых, но таким образом,
чтобы преобразованная задача содержала оптимальное решение. Если в традиционных
постановках вырожденных задач управления сингулярная кривая подлежит определению, то в преобразованной задаче она известна: ею является оптимальная траектория
исходной задачи.
Показано, что нечеткие системы регулирования совместимы с логическими процедурами более высокого уровня управления.
Наиболее важным представляется тот факт, что задача нелинейного синтеза формулируется в вырожденной (синергетической) постановке, которая необходима для исследования диссипативных (открытых, самоорганизующихся) систем.
2. Постановка задачи приближенно-оптимального синтеза
Под оптимизацией непрерывных процессов управления будем понимать решение
задачи выбора на отрезке времени T  [t 0 , t к ] позиционного управления
u  u (t 0 , x(t 0 ), t , x(t ))
(1)
и/ или состояния
x  x(t 0 , x(t 0 ), t , u (t ))
(2)
для динамической системы
x  f (t , x , u)
(3)
такого, чтобы на траектории движения объекта x(t ) , удовлетворяющей заданным ограничениям на множествах начального и конечного состояний
 (t 0 , x(t 0 ), t к , x(t к ))  0,
  Rp,
(4)
функционал
tк
(5)
I  Vз (t 0 , x (t 0 ), t к , x (t к ))   f 0 (t , x (t ), u(t ))dt ,
I  R1 ,
t0
достигал минимума (максимума) или наименьшей (наибольшей) точной грани (инфиXII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
759
мума inf или супремума sup ). Здесь функции f ,  ,Vз и f 0 – заданные кусочнонепрерывные по t и непрерывные и достаточно гладкие по x , u (дифференцируемые
или кусочно-дифференцируемые) векторные и скалярные функции указанных аргументов.
В дальнейшем будем рассматривать менее общую постановку задачи оптимизации
– постановку задачи нелинейного синтеза ОУ, для которой условие (3) без потери общности может учитываться в конструкции модифицированного лагранжиана; а скалярная
функция Vз ( x (t к ))  Vз (t к , x (t к )) определяет граничные условия только на правом конце
траектории (терминальное множество). Граничные условия на левом конце траектории
x (t 0 )  x 0  R n выбираются произвольными. Конечные ограничения на граничные условия и на значения управляющих функций и траектории процесса (3) будем записывать как
( x (t ), u(t ))  F (t ),
(6)
где F (t )  G x  Gu ,G x  X ,Gu  U является декартовым произведением множеств топологической степени (n  m) , зависящим от времени t .
Множество пар вектор-функций {x ( t ), u ( t )} , удовлетворяющих дифференциальной связи (3) и конечным ограничениям (6), называют множеством допустимых D .
Предполагается, что D   .
Пару функций {x оп ( t ), uоп (t )}  D будем называть оптимальным процессом (минималью) для I на D , если
I ( xоп (t ), uоп (t ))  d .
(7)
Здесь d  inf I ( x (t ), u(t )) — нижняя точная грань функционала (5).
D
Функционал (7) в общей теории экстремальных задач называют опорным функционалом (опорой) [6].
Последовательность {x s (t ), us (t )}  D , на которой
I ( xs , us ) s
 d ,
(8)

является минимизирующей для функционала I на множестве D .
Введем непрерывную и достаточно гладкую (дифференцируемую или кусочнодифференцируемую) функцию  (t , x ) Ф и рассмотрим следующие конструкции
 (t , x )  (t , x)
(9)
R ( t , x , u) 

f (t , x , u)  f 0 (t , x , u),
t
x
Ф( x (t 0 ), x (t к ))  Vз ( x (t к ))   (t к , x (t к ))   (t 0 , x (t0 )) .
(10)
Достаточные условия абсолютного минимума задачи (1) - (6) формулируются теоремой о минимали (теоремой В.Ф. Кротова для двойственной задачи) [7].
Теорема 1. Для того чтобы пара ( xоп , uоп )  D была минималью в задаче (1) - (6)
достаточно существования такой гладкой функции  (t , x) , чтобы выполнялись условия
(t)  R(t, xоп ,uоп )  inf R(t, x,u) для любого t [t 0 , t к ] ,
(11)
( x,u)F(t )
(12)
Ф(xоп(t0 ),xоп(tк ))  inf Ф(x(t0 ),x(tк )),
x(t0 )Fx (t0 )
x(tк )Fx (tк )
где включение x (t )  Fx (t ) определяет ограничение на значения вектора состояния
системы (1), Fx (t ) – проекция множества F (t ) на пространство X .
Доказательство теоремы связано с реализацией принципа снятия части ограничений на условия задачи (1)-(6) за счет игнорирования дифференциальной связи (3), то
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
760
есть за счет перехода к так называемой тривиальной задаче [7] на расширенном множестве E  F (t )  D .
Имеющийся произвол в задании функции  (t , x ) позволяет лучше приспособиться
к специфике конкретной задачи и определяет метод ее решения. Связь с другими методами оптимизации рассмотрена в ряде монографий [7]. При этом к выбору функции
 (t , x ) можно подходить таким образом, что аналогов среди известных методов не будет [8]. Однако такая общность допускает множество частных рекомендаций и методик, которые тесно связаны с опытом разработчика, а, значит, приближаются к искусству. Конкретные примеры и практические результаты применения теоремы 1 можно
найти в [6-8].
3. Принцип локализации и улучшения в задаче
оптимизации по неклассическим функционалам
качества
В данном параграфе ставится и решается задача синтеза нелинейных систем управления по неклассическим функционалам качества с непрерывным и ограниченным (в
том числе с нечетко заданным параметром  *  [0,1] ).
Включение непрерывного нечетко заданного параметра осуществляется через
функционал качества некоторой другой задачи управления, называемой задачей улучшения [6-8] (деформационной вариационной задачи [9]). Если в процессе решения задачи улучшения ее экстремаль остается изолированной и если при каком-либо значении параметра    * эта экстремаль реализует минимум, то она реализует минимум
исходной задачи оптимального управления (ОУ) при всех значениях этого параметра.
Это основное положение в различных приложениях строго доказывается в монографиях [9, 10].
3.1. Улучшение и принцип локализации
В задаче оптимизации непрерывных процессов (1) - (6) вместо функционала (5)
будем использовать семейство функционалов
I  ( z )  I ( z )  (1   ) J ( z , z* ) ,
(13)
tк
где z  ( x, u )  D ,   [0,1] , I ( x, u )  Vз ( x(tк ))   f 0 (t , x, u )dt , функционалы J ( z , z* ) в
t0
рамках развиваемого подхода, связанного с квазилинеаризацией в окрестности точек
стационарности, имеют смысл функционалов расстояний и для конкретных схем динамического программирования (ДП) записываются в виде:
1) для схемы дифференциального ДП: J  J 1 (u , u 0 ) ;
2) для схемы приближений в пространстве политик: J  J 2 ( x, x0 ) ;
3) для аналога вариационной схемы: J  J 1 (u , u 0 )  J 2 ( x, x0 ) .
Покажем, каким образом постановка задачи улучшения на основе принципа локализации соотносится с точной формулировкой задачи синтеза (1) - (6). Для этого перепишем однопараметрическое семейство функционалов (13) в виде
I  ( z )   [ I ( z )  J ( z , z* )]  J ( z , z* )
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
761
где выражение в квадратных скобках соответствует доопределению опорного функционала I *  I ( z* )  inf I ( z ) до функционала (5) исходной задачи
D
I  ( z )  I ( z * )  J ( z , z * ) .
(14)
В зависимости от выбранной системы ДП [5] выражение (14) принимает вид:
1) для схемы дифференциального ДП
I  ( x0 , u )   [ I ( x0 , u )  J 1 (u , u0 )]  J 1 (u , u 0 ) ,
(15)
2) для схемы приближений в пространстве политик
I  ( x, u0 )   [ I ( x, u 0 )  J 2 ( x, x0 )]  J 2 ( x, x0 ) ,
(16)
3) для аналога вариационной схемы
I  ( x, u )   [ I ( x, u )  J 1 (u , u 0 )  J 2 ( x, x0 )]  J 1 (u, u 0 )  J 2 ( x, x0 ) .
(17)
Если для семейства функционалов (15)-(17) при   1 дополнительно выполняется
предположение об оптимальности по переменным x и/ или u на отрезке [t , tк ] , то
inf I  ( x, u )  S ( x0 )  S (u 0 )  I ( x0 , u 0 )  inf I ( x, u )  I * .
D
D
Таким образом, конкретные конструкции однопараметрического семейства функционалов в задаче улучшения и локализации (1)-(4), (6), (13), полученные через квазилинеаризацию дифференциальной связи (3) и интегрантов в критериях (15)-(17), имеют
вид:
1) для схемы дифференциального ДП
tк
I (u ())  I*   (
t0
f 0
u )dt ,
u
2) для схемы приближений в пространстве политик
tк
I ( x())  I *   (
t0
f 0
x)dt ,
x
3) для аналога вариационной схемы
tк
I ( x(), u ())  I*   (
t0
f
f 0
u  0 x)dt ,
x
u
tк
где I*  Vз ( x0 (tк ))   f 0 (t , x0 (t ), u0 (t ))dt – опорный функционал исходной задачи синтеза
t0
(1)-(6).
В основу построения схем приближенно - оптимального синтеза здесь положен гомотопический метод (метод продолжения по параметру [9]). Общая схема метода имеет
простую и наглядную трактовку: если имеется какое-либо уравнение и нужно получить
информацию об его решениях (доказать существование решения, локализовать решение или построить приближения к решению), то это уравнение включают в некоторое
специальным образом построенное однопараметрическое семейство уравнений, сводящее изучаемое уравнение к эталонному уравнению, решение которого известно. Затем
это решение «притягивается по параметру» к отыскиваемому решению исходного
уравнения. Поясним эту схему на формальном уровне в нашем случае.
Предположим, что требуется определить абсолютный локальный минимум функционала (5) из условия
I ( z)  0
(18)
и включить (18) в однопараметрическое семейство функционалов
I ( z)  0 , 0    1
(19)
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
762
Условие (18) иначе записывается в виде
I ( z * )  J ( z , z* )  0 .
(20)
Аналогично через формулу (13) переписывается условие (19)
I ( z* )  J ( z , z * )  0 .
(21)
При   0 уравнение (21) имеет решение z  z* , получаемое из эталонного уравнения J ( z , z* )  0 оптимизационной задачи, а при   1 решения уравнений (20) и (21)
совпадают.
Таким образом, задача ( I , D ) погружается в однопараметрическое семейство задач
синтеза ( I , D ), решение которых при некотором параметре    * 1 притягивается к
решению исходной задачи.
Схема решения задачи улучшения и локализации может быть представлена в непрерывном или дискретном виде. В случае дискретного представления промежуток
[0,1] разбивается точками 0   0  1     n  1 на n равных частей. В качестве паt
раметра  здесь естественно принять относительное время  i  i , ti  [t0 , tк ] . Тогда в
tк
начальный нулевой момент времени t 0  0 параметр  0  0 , а в конечный момент времени –  n  1 . Шаг дискретизации можно выбрать из условия [10]
  max ( i 1   i ) .
0  i  n 1
Если  достаточно мало, то можно предположить, что точка z (0)  z* будет близка
к решению z (1 ) уравнения (21). Беря ее в качестве начального приближения какойлибо итерационной процедуры (например, метода Ньютона), находим с достаточной
точностью новое приближение z1 к z ( 1 ) . Точка z1 , в свою очередь, рассматривается
как начальное условие в (21) к приближенному построению решения z ( 2 ) и т.д. На
последнем шаге с нужной точностью получается решение z (1) , которое одновременно
локализует решение уравнения (18).
3.2. Квазилинеаризация и достаточные условия
оптимальности в задаче продолжения по параметру
В параграфе через продолжение решений оптимизационной задачи ( I , D ) по непрерывному ограниченному параметру обобщается подход, основанный на сочетании
идеи квазилинеаризации с достаточными условиями оптимальности Беллмана – Кротова. Суть такого обобщения заключается в следующем. Сначала через достаточные условия оптимальности осуществляется грубый поиск начального приближения оптимального решения, а затем итерационным путем полученное решение раздельно уточняется через его продолжение по параметру   [0,1] и по условиям локальной опти-
мальности: стационарности ( U  R m ) или в форме принципа минимума ( U  R m ).
Такое раздельное уточнение начального приближения полученного при интервальной оптимизации решения становится очевидным, если обратиться к формализму формулировок задачи улучшения и локализации по схемам ДП: в семействах функционалов (15)-(17) параметр  изменяет свойства только опорного функционала
S ( x0 )  S (u 0 )  I ( x0 , u 0 )  I * и не оказывает влияния на условия локальной оптимальности.
Последнее утверждение поясняют следующие математические выкладки.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
763
А) Достаточные условия абсолютного минимума. В исходных конструкциях (11),
(12) теоремы 1 учтем разложение функций f и f 0 в ряд Тейлора в малой окрестности
локальной минимали ( x0 , u 0 )
f (t , x0 , u )
f (t , x,u 0 )
f (t , x,u )  f (t , x0 ,u 0 ) 
x 
u  o1 ( x,u ),
x
u
f (t , x0 , u)
f (t , x,u 0 )
f 0 (t , x,u)  f 0 (t , x0 ,u 0 )  0
x  0
u  o2 ( x,u ) .
(22)
x
u
Тогда достаточные условия абсолютного минимума (11), (12) с учетом (22) перепишутся в виде
(t, x) (t, x)
(t, x) f f 0
f (t, x0 , u0 )  f 0 (t, x0 , u0 ))  inf ([
inf (

 ]x) 
xFx
x

F
x
t
x
x x x
(23)
 (t , x )  f  f 0
 inf ([

] u )  o (  x ,  u )   (t ),
uU
x u u
inf
(24)
x ( t 0 ) Fx ( t 0 )
x ( t к )  Fx ( t к )
((
 V з ( x 0 ( t к ))  ( t к , x 0 ( t к ))
 ( t 0 , x 0 ( t 0 ))

) x ( t к ) 
 x ( t 0 ))  0.
x (t к )
x (t к )
x (t 0 )
Формула (23) через скалярную функцию H (t , x ,  x , u) 
 (t , x )
f  f 0 при допуx
щении o x, u   (t ) принимает более компактный вид
H (t, x0 , x , u)
(t, x) (t, x)

x) 
f (t, x0 , u0 )  f 0 (t, x0 , u0 ))  inf (
xF
xF
x
t
x
H ( t , x ,  x , u 0 )
 inf (
u )  0.
uU
u
inf (
x
(25)
x
Непосредственно из формул (24), (25) видно, что условия локальной оптимальности (условия стационарности) не зависят от параметра  , что и требовалось показать.
Б) Необходимые и достаточные условия слабой, сильной и абсолютной локальной
минимали в методе продолжения. Из теоремы 1 и анализа формул (24), (25) формулируется ряд положений, обобщающих условия теорем 2-5 работы [5].
Теорема 2 (обобщение необходимых и достаточных условий локальной оптимальности в форме принципа минимума). Если в задаче (1)-(4), (6), (13) существует локальная минималь ( x0 , u0 ) , то в каждой точке стационарности выполняются следующие
условия:
(t, x0 ) (t, x0 )
(t, x0 )

f (t, x0 , u0 )  f 0 (t, x0 , u0 )  0,
  T (t ) ,
1)
t
x
x
V3 ( x0 (t к ))   (t к , x0 (t к ))   (t 0 , x0 (t 0 )) ,
2)
H (t , x0 , )  H (t , x0 , , u 0 )  inf H (t , x0 , , u ).
3)
uU
Здесь условиям 1), 2) соответствует канонически сопряженная система уравнений:
уравнения оптимального процесса и косостояний
H  (t , x 0 , )
x 0 
 f (t , x 0 , u0 ), x 0 (t 0 )  x 0 ,

  
(26)
f (t , x0 , u0 )
f T (t , x0 , u0 )
V ( x (t ))
  0
,  T (tк )   3 0 к .
x
x
x(tк )
T
Если
условие
3)
разрешимо
относительно
вектора
управления
u 0 (t )  arg min H (t , x0 , , u ) , то в локальном смысле доставляется минимум функционаuU
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
764
I *  inf I ( x, u ) ,
лу
( x , u )D
а,
следовательно,
и
минимум
функционалу
I  ( x0 , u 0 )  inf I  ( x, u )  I * . Другими словами, решение оптимизационной задачи (1)
( x , u )D
- (4), (6), (13) при любом непрерывном ограниченном параметре  из промежутка [0,1]
гомотопирует к решению исходной задачи синтеза (1) - (6) и как бы деформирует это
решение. Поэтому параметр  называется параметром деформации [10]. Справедливо
и обратное утверждение.
Утверждение 1. Если в процессе деформации исходной задачи синтеза (1) - (6) ее
экстремаль остается изолированной и при каком - либо значении параметра деформации эта экстремаль доставляет минимум семейства функционалов (13), то она
реализует минимум задачи улучшения (1) - (4), (6), (13) при всех значениях этого параметра.
Теорема 3 (обобщение необходимых и достаточных условий слабой локальной
минимали). Для того чтобы пара ( x0 , u 0 ) была слабой локальной минималью задачи
(1)-(4), (6), (15), необходимо и достаточно выполнение следующих условий:
(t, x0 ) (t, x0 )
(t, x0 ) S (t, x0 )


  T (t ) ,
f (t, x0 , u0 )  f 0 (t, x0 , u0 )  0,
1)
t
x
x
x
2)
V3 ( x0 (tк ))   (tк , x0 (tк ))   (t0 , x0 (t0 )) ,
H (t , x0 , u0 )
 0 для u  intU или U  R m и при ненулевой допустимой ваu
риации управления u .
3)
Теорема 3 обобщает решение задачи локально-оптимального синтеза управлений
по схеме дифференциального ДП на случай регулятора с нечетко заданным параметром. Здесь локальное улучшение управления производится в два этапа. На первом этапе по условиям 1), 2) определяются грубые начальные приближения в точках стационарности по управлению, которые итерационным путем уточняются через дискретное
изменение параметра деформации  . Если при каком-либо значении параметра    *
доставляется минимум функционалу (15) (утверждение 1), то через квазилинеаризацию
дифференциальной связи (3) и интегранта семейства функционалов качества (22) в малой окрестности u 0 (t )
f
u ,
x  f ( t , x 0 , u 0 ) 
(27)
u
t
 f

I  (u ())   * I *    0 u dt
u 
t 
к
0
организуется процедура приближений uоп (t , )  uоп (t , t )  u0 (t ) . Значения функциона t
лов стремятся к нижней точной грани  * I * :inf I    * I * и при  *  1 приближенно
D
достигается нижняя точная грань I * функционала исходной задачи (1) - (6).
Теорема 4 (обобщение необходимых и достаточных условий сильной локальной
минимали). Для того чтобы пара ( x0 , u 0 ) была сильной локальной минималью задачи
(1)-(4), (6), (16) необходимо и достаточно выполнение следующих условий:
(t, x) (t, x)
 (t , x)
inf (

f (t, x0 , u0 )  f 0 (t, x0 , u0 )  0,
 p T (t ),
1)
xFx
t
x
x
2
inf ((
x ( t ) F ( t )
0
x
0
x ( t к ) Fx ( t к )
Vз ( x0 (t к ))  (t к , x0 (t к ))
 (t 0 , x0 (t 0 ))
x(t 0 ))  0.

)x(t к ) 
x(t к )
x(t к )
x(t 0 )
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
765
3)
n
 H (t , x 0 , p , u 0 )
 0 для X  R и при ненулевой допустимой вариации
x
траектории x .
Теорема 4 обобщает решение задачи локально-оптимального синтеза по методу
приближения в пространстве политик при синтезе регулятора с нечетко заданным параметром.
Здесь локальное улучшение траектории также включает два этапа. Первоначально
по условиям интервальной оптимальности 1), 2) определяются грубые начальные приближения в точках стационарности по переменной x , которые итерационным образом
уточняются через дискретное изменение параметра  . На втором этапе при некотором
значении параметра    * , доставляющем минимум функционалам (16), осуществляется квазилинеаризация дифференциальной связи (3) и подынтегрального выражения
(16) в малой окрестности x0 (t )
f
(28)
x  f (t , x 0 , u 0 )  x ,
x
tk
 f

I  ( x ())   * I *    0 x dt ,
x 
t0 
и через процедуру приближений x( )  x0 ( t ) определяется его нижняя точная грань:
 t
inf I    * I * . При  *  1 , как и при вычислениях по схеме дифференциального ДП,
D
приближенно достигается нижняя точная грань I *  inf I функционала задачи (1)-(6).
D
Теорема 5 (обобщение необходимых и достаточных условий абсолютной локальной минимали). Для того чтобы пара ( x 0 , u0 ) была абсолютной локальной минималью
задачи (1)-(4), (6), (17), необходимо и достаточно выполнение следующих условий:
(t, x) (t, x)
 (t , x)
1)
inf (

f (t, x0 , u0 )  f 0 (t, x0 , u0 )  0,
 p T (t ),
xFx
t
x
x
V ( x (t ))  (t к , x0 (t к ))
 (t 0 , x0 (t 0 ))
2)
x(t 0 ))  0 ,
inf (( з 0 к 
)x(t к ) 
x ( t )F ( t )
x
t
x
t
x
t



(
)
(
)
(
)
x ( t ) F ( t )
к
к
0
0
к
3)
ектории x ,
x
x
0
к
H (t , x0 , p, u )
 0 для X  R n и при ненулевой допустимой вариации траx
H (t , x, p, u 0 )
 0 для u  int U или U  R m и при ненулевой допустимой
u
вариации управления u .
4)
Теорема 5 обобщает решение задачи локально-оптимального синтеза по аналогу
классической схемы вариационного исчисления на случай синтеза регулятора с нечетко
заданным параметром. Локальное улучшение управления и состояния включает несколько этапов. Сначала по условиям интервальной оптимальности 1), 2) вычисляются
грубые начальные приближения решения задачи синтеза в точках стационарности по
переменным x и u . Затем через варьирование параметра деформации по условию минимума функционалов (17) итерационным путем уточняются начальные приближения
точек стационарности. Далее при некотором наилучшем в смысле минимума функционалов значении параметра    * осуществляется квазилинеаризация дифференциальной связи (3) и интегранта функционалов (17) в окрестности локальной минимали
( x 0 , u0 )
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
766
(29)
f
f
x  u ,
x
u
t
f
 f

I ( x(), u ())   * I *    0 x  0 u dt
x
u 
t 
x  f (t , x 0 , u0 ) 
к
0
и через организацию итерационных процедур: uоп (t ,  )  uоп (t , t )  u0 (t ) и x( )  x0 (t )
 t
 t
обеспечивается выполнение условий: inf I    * I * , inf I   inf I  I * при  *  1 .
D
D
D
Утверждения теорем 2-5 реализуются в конкретных конструкциях алгоритмов слабого и сильного улучшения, а также в процедуре поиска абсолютной локальной минимали.
3.3. Алгоритмы приближенно-оптимального синтеза по схеме улучшения
и локализации
Для практической реализации рассмотренных выше схем ДП задачи (1) - (4), (6),
(13) необходимо сформировать стратегию приближенно - оптимального синтеза через
релаксационное расширение пространства состояний, которое связано с исследованием
свойств предельных элементов минимизирующих последовательностей поиска управлений и/ или траекторий и с их фиксацией в точках стационарности на основе применения ФОР А.А. Красовского.
Метод и алгоритмы получения оптимального решения на основе итерационных
процедур поиска слабой, сильной и абсолютной минималей подробно рассмотрены в
работах [5, 11, 12].
Аналогичные результаты могут быть сформулированы и в общем случае при применении метода продолжения по параметру.
Требуется организовать итерационные процедуры поиска слабой (теорема 3), сильной (теорема 4) и абсолютной (теорема 5) минималей, обеспечивающие инфимум ФОР
tк
(30)
I  ( y ())  S 3 ( y (t к ))   [Qр ( , y )  L31 ( )  L31 ( 0 )  L32 ()  L32 (0 )]d
t0
при дифференциальных связях (27), (28), (29). Интегранты линеаризованного в окрестности векторов u0 и/ или x 0 семейства функционалов (13) задаются в виде:
Qр (t , y )  f 0 (t , x0 , u 0 ) 
f 0
u
u
– для схемы дифференциального ДП,
Qр (t , y )  f 0 (t , x0 , u 0 ) 
f 0
x
x
– для схемы приближений в пространстве политик,
f
f
Qр (t , y )  f 0 (t , x0 , u 0 )  0 x  0 u
x
u
– для аналога вариационной схемы.
Утверждения теорем 3-5 конкретизируются через применение метода характеристических полос. Наиболее общий вид алгоритмов с нечеткой прогнозирующей моделью по схемам ДП соответствует аналогу вариационной схемы и формулируется следующей теоремой.
Теорема 6. Для процесса (3) оптимальные в смысле достижения локального минимума семейства функционалов (17) и семейства ФОР (30) управление и состояние определяются
процедурой
поиска
абсолютной
локальной
минимали
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
767
uоп (t , )  uоп (t , t )  u0 (t ) , x( )  xоп (t )  x0 (t ) , формируемой через решение канонически
 t
 t
сопряженной системы: дифференциальной связи (29) и уравнений

f  (t , x0 , u ) f  (t , x0 , u )
 (x  p x )  (u  p u )
, px (tк )   Vз ( x(tк )) ,
p x   0
px 


x
x
x
x
x(tк )
f 0 (t , x0 , u ) f  (t , x0 , u )
f  (t , x, u0 ) f  (t , x, u0 )

px , p u   0

px ,
x
x
u
u
   px ,   rpu ,
p x  
f0 (t , x0 , u )
f (t , x, u0 )
x  0
u ,  (tк , x(tк ))  V3 ( x(tк )) ,
x
u
где  – функция Ляпунова – Кротова для задачи с расширенным вектором состояния
 (t , x, x, u )  f 0 (t , x0 , u0 ) 
 
 
 
( x, x, u ) , px 
, px 
, pu 
, а параметр  непрерывно или дискретно
x
x
u
изменяется по условиям организации внешнего контура.
Доказательство теоремы 6 осуществляется по методике, изложенной в работе [5],
через прямое преобразование достаточных условий оптимальности Беллмана – Кротова
к более простым достаточным условиям в форме уравнения Ляпунова для расширенного пространства состояний с последующим решением уравнения в частных производных методом характеристик.
Структуры алгоритмов с нечетко заданной прогнозирующей моделью имеют два
контура (рис.1). При реализации схем ДП они содержат внутренний контур для уточнения точек стационарности по условиям u  0 и/ или x  0 и внешний контур –
для определения наилучшего в смысле минимума функционалов (17)-(19) параметра
   * , при котором получаемое решение гомотопирует к оптимальному решению исходной задачи (1)-(6).
Информ ацион ный уровень инт ерфейса с
вне шней средой
Изменен ие качества за счет н ечетко
заданного п араметра функционала
ВНЕШНИ Й
КОНТУР
Совме щенный синт ез регулятора п о схемам
ДП
Показатель
качества
ВНУТРЕНН ИЙ КОНТУР
+
Желаемый
входной
сигнал
_
Ошибка
Нечеткий
регулятор
Процесс
ПМ
Рис. 1. Структура нечеткого регулятора.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
Выходной
сигнал
768
Параметр  имеет смысл функции принадлежности и путем количественной интерпретации содержательного смысла нечетких значений лингвистических переменных
позволяет количественно описать поведение системы управления.
Нечеткие регуляторы в неявной форме, в которых используется промежуточная
модель процесса (в нашем случае прогнозирующая модель) для синтеза в реальном
времени, именуются самоорганизующимися, основанными на нечеткой логике [13].
Добавление более высокого (информационного) уровня необходимо для создания
автоматизированных продукционных систем поддержки принятия решения (СППР) и
встраивания других функций, например, таких как интеграция возможностей человека
и машины; интеллектуальный интерфейс; приближение конструктивных и алгоритмических решений к организации деятельности человека; моделирование деятельности
оператора и др.
4. Заключение
На основе условий теорем 3-6 разработано алгоритмическое обеспечение интегрированной САУ, стратифицированное по уровням управления воздушным судном (информационный, траекторный и пилотажный уровни). Работоспособность алгоритмов
нелинейного синтеза проверена на ряде тестовых примеров и на модельных задачах
динамики перспективных автоматизированных систем предупреждения столкновений и
преодоления сдвига ветра при заходе на посадку самолета среднего класса.
Список литературы
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
Справочник по теории автоматического управления / Под ред. А.А. Красовского. М.: Наука, 1987,
712 с.
Буков В.Н. Адаптивные прогнозирующие системы управления полетом. М.: Наука, 1987, 230 с.
Габасов Р., Кириллова Ф.М. Принципы оптимального управления // Доклады НАН Беларуси, 2004.
Т. 48. С. 15-18.
Беллман Р., Калаба Р. Квазилинеаризация и нелинейные краевые задачи. М.: Мир, 1968, 184 с.
Мухопад Ю.Ф., Сизых В.Н. Квазилинеаризация и достаточные условия оптимальности // Проблемы
информатики. 2012. № 3 (15). С. 39-55.
Кротов В.Ф., Букреев В.З., Гурман В.И. Новые методы вариационного исчисления в динамике полета. М.: Машиностроение, 1969, 287 с.
Гурман В.И. Принцип расширения в задачах управления. М.: Наука, 1997, 288 с.
Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977, 304 с.
Емельянов С.В., Коровин С.К., Бобылев Н.А., Булатов А.В. Гомотопии экстремальных задач. М.:
Наука, 2001, 350 с.
Бобылев Н.А., Емельянов С.В., Коровин С.К. Геометрические методы в вариационных задачах. М.:
Изд-во Магистр, 1998, 658 с.
Сизых В.Н. Итерационно-релаксационный метод приближенно-оптимального синтеза регуляторов //
Доклады РАН, 2000. Т. 371, № 5. С. 571-574.
Сизых В.Н. Итерационно-релаксационный метод нелинейного синтеза регуляторов // Автоматика и
телемеханика. 2005, № 6. С. 108-119.
Васильев С.Н., Жерлов А.К., Федосов Е.А., Федунов Б.Е. Интеллектное управление динамическими
системами. М.: Физ.-мат. лит., 2000, 352 с.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
1/--страниц
Пожаловаться на содержимое документа