When Love Lies Elsewhere;pdf

471
УДК 62-50:681.511.43
ОПТИМАЛЬНОЕ РЕЛЕЙНОЕ
УПРАВЛЕНИЕ С ПРОГРАММНО
РЕАЛИЗУЕМОЙ ОБРАТНОЙ СВЯЗЬЮ
А.А. Шилин
Национальный исследовательский Томский политехнический университет
Россия, 634050, Томск, проспект Ленина, 30
E-mail: [email protected]
В.Г. Букреев
Национальный исследовательский Томский политехнический университет
Россия, 634050, Томск, проспект Ленина, 30
E-mail: [email protected]
Ключевые слова: теплообменная система, релейное управление, скользящий режим,
принцип максимума, транспортное запаздывание
Аннотация: Представлены результаты исследования некоторых методов синтеза оптимальных нелинейных систем с релейным элементом, охваченным программнологической обратной связью. Основой синтеза алгоритмов является организация скользящего режима для объекта второго порядка, где параметр траектории скольжения на
фазовой плоскости определяется по критерию максимального быстродействия. Предложенные алгоритмы апробированы на примере нелинейной теплообменной системы в
двух вариантах. В первом варианте – регулируемой переменной является температура
подающего теплоносителя, во втором – температура обратного теплоносителя со значительным транспортным запаздыванием. Для сравнительного анализа использовалось оптимальное управление теплообменной системой на основе решения уравнения Риккати
для полностью наблюдаемой линеаризованной модели.
1. Введение
В промышленности и жилищно-коммунальном хозяйстве имеется значительное
количество теплообменных систем (ТОС), где расход теплоносителя в первичном контуре регулируется электромеханическим клапаном (ЭМК). Большая часть таких автоматических систем должны обладать свойством самонастройки регулятора с целью
обеспечения жизнедеятельности важных объектов без участия обслуживающего персонала. Традиционно для таких систем используются специализированные программируемые логические контроллеры (ПЛК), библиотека алгоритмов которых содержит, в
основном, алгоритм ПИД-регулятора с постоянными или перенастраиваемыми параметрами [1]. Преобразование выходного сигнала ПИД-регулятора в трех-позиционный
входной сигнал управления ЭМК обеспечивается широтно-импульсным модулятором
второго рода с изменяемой характеристикой. Однако ПИД законы регулирования не
решают проблему быстродействия ТОС, используемых, в частности, для энергооптимального горячего водоснабжения ответственного технологического оборудования,
зданий и сооружений с распределенной трубопроводной схемой [2].
Наиболее эффективным методом синтеза оптимальных по быстродействию систем
с эффектом робастности к внешним возмущениям является организация скользящего
режима для релейного управления рассматриваемым объектом [3, 4]. Так в работе [5]
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
472
предложено два варианта подстройки параметра траектории скольжения, позволяющие
улучшить свойства оптимального регулятора в скользящем режиме для стационарных
условий. Используя принцип максимума Понтрягина, точка переключения скользящих
режимов определяется подбором параметра траектории скольжения, обеспечивая необходимое быстродействие. Такие системы имеют наилучшие характеристики по быстродействию и робастности, но алгоритм управления в практических приложениях достаточно трудно реализуется на микроконтроллерах с 10-12 разрядными аналогоцифровыми преобразователями, так как существует проблема обеспечения необходимой точности при оценке производной измеряемого сигнала.
Для подобных систем широко используется технология синтеза ПИД-регулятора с
релейным элементом, охваченным отрицательной обратной связью, при условии, что
эквивалентная передаточная функция релейного элемента обратно пропорциональна
передаточной функции в цепи обратной связи [6, 7]. Такой подход синтеза весьма эффективен, но остается в рамках линейной или линеаризованной системы, что не позволяет использовать весь ресурс метода управления с релейным элементом.
В данном докладе представлены результаты исследований регулятора с релейным
элементом, охваченным сложной, программно реализуемой обратной связью. Следует
отметить, что понятие «сложность» предполагает широкие возможности программной
реализации обратной связи, а не трудность или невозможность реализации. В результате, алгоритмы управления являются функционально насыщенными и не предъявляют
жестких ограничений к характеристикам АЦП, в частности, создаются хорошие предпосылки их реализации на 8-ми разрядном ПЛК для эксплуатируемых теплообменных
систем.
2. Постановка задачи
В качестве исходной математической модели ТОС принимается система нелинейных дифференциальных уравнений [2, 8]:

 dK ñì = k  K t   k h  u t 
max
ñì
 dt
Tïð





T1  Tîá1
 K ñì + Tîá1
 Tïä1
 dTïä1
=
 dt
Tñì




 dTïä2
k  T  + 1  ktob   Tîá2
 Tïä2
= tob ïä1

Ttob
 dt
 dT 



ktob  Tîá2
+ 1  ktob   Tïä1
 Tîá1
îá1
=

Ttob
 dt

 dT 
T   Tïä3
 ïä3 = ïä2
Táê
 dt





 dTîáz
Tîáz


i, j 
i, j 1  Tîáz i, j  

i
=
1...
n


j
=
1...
m

=





dt
τ z i  / m 






 



 dTîá2 = Tîá3  1  k õâ + k õâ  Tõâ  Tîá2
(1)
 dt
Tõâ









XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
473




i = 1...n  Tобz
 i ,0  = 1  kост   Tпд3  t  + kост  Tком
n
n
i=1
i=1



Tоб3
=  kci  Tobz
 i,m  ,где kci = 1






где K см ,Tпд1
,Tпд2
,Tпд3
,Tоб1
,Tоб2
,Tобz
 i, j  – переменные состояния: коэффициент смешения в
клапане, температура подающего теплоносителя во входном и выходном контуре, на
выходе ТОС, температура обратного теплоносителя во входном и выходном контуре,
температура в распределенной системе транспортного запаздывания, количество которых определяется количеством n стояков-ответвителей и степенью m детализации
транспортного запаздывания инерционными звеньями. Параметры объекта: k max и kh –
коэффициенты аппроксимации нелинейных свойств смешения в клапане [8], Tpr – время полного хода электромеханического привода; Tпр ,Tсм ,Ttob ,Tбк ,Tхв – параметры, характеризующие время инерции в клапане смешения, теплообменника, накопительного
бака, на узле смешения теплоносителя с холодной водой.
Используем процедуру линеаризации исходной математической модели ТОС с последующей аппроксимацией многомерной системы большого порядка нелинейными
уравнениями с запаздыванием в управляющем воздействии:
1

 x1 = T  t,x    x2  x1 
(2)
,
o

 x = k  t,x   u  t  τ  t,x  
u
z
 2
где
ku  t, x  =

0
k h  ktob   k max  K см
  T1  Tоб10   1  1  ktob   1  K см0 

1
Tпр
To = Tбк

Tбк > Tсм 
0
 τ z  t, x  = ktt  K см   Tсм +Tob


,
0
To  t, x  = ktt  K см
  Tсм
Tбк < Tсм 
τ z = Tбк +Tob

ku  t, x  – эквивалент коэффициента передачи объекта управления, ktt K ñì   [1... 2 ] – числовой
коэффициент, изменяемый в заданных пределах.
На основе данной модели ТОС, при известных ограничениях, можно построить оптимальное управление по принципу максимума Понтрягина, обеспечивающее максимальное быстродействие двумя воздействиями [9]. На рис. 1a представлено семейство
оптимальных фазовых траекторий, полученных в результате моделирования работы
регулятора в скользящем режиме, где недостаточная точность вычисления параметра
скольжения может служить причиной возникновения скользящего режима в окрестности установившихся значений [5].
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
474
a
b
Рис. 1. Семейство фазовых траекторий оптимального робастного управления в скользящем режиме.
Робастные свойства такой системы в условиях изменения параметра объекта
ku  [k uo ...k umax ] наглядно отражены на фазовой плоскости, где траектории устойчиво
сходятся к нулевой точке (рис.1b). В качестве общей постановки задачи будем рассматривать организацию формирования параметров обратной связи релейного элемента для
определения момента переключения управления в соответствии с положением фазовой
точки на кривой переключения. В таком случае алгоритм управления не будет оперировать значением производной и положением в фазовом пространстве, а определяться
динамическими свойствами обратной связи релейного элемента, которая может быть
представлена в виде дифференциальных уравнений и программно-логических решений.
Далее для синтеза регулятора используется модель (2) объекта второго порядка с

регулированием переменной состояния Т об1
, а работоспособность полученного алгоритма доказывается на исходной математической модели (1) относительно переменной

состояния Т пд3
.
3. Формирование алгоритма
3.1. Замкнутая система для объекта без запаздывания
Большинство алгоритмов управления, реализующих как динамические модели, так
и программно-логические структуры, достаточно сложно получить путем прямого синтеза на основе решения вариационных задач с заданным функционалом. По этой причине многие интересные приложения могут быть получены в результате определенного
количества экспериментальных исследований и интуитивных предположений. Используя такую технологию, рассмотрим систему дифференциальных уравнений замкнутой
системы [10]:
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
475
1

 x1 = T   x2  x1 
о

 x = ku  u, где u = if   x3  x1  > δ 
u = sign  x3  x1 
 2


elseif   x3  x1   u1   0 u = 0



u = u 1
else

 x3
(3)
 x3 = if  u = 0 


Tob


if sign  x1  t   u  t   < 0
u



Tp1  C1 


if sign  x  t   u  t   > 0

u
1


Tp2  C1 



где δ – зона гистерезиса релейного элемента. Поведение переменной состояния x3 определяется обратной связью, которая, в данном случае, имеет не только динамические
свойства, но и включает логические алгоритмы. Параметрами, определяющими динамические свойства обратной связи, являются:
 постоянная Tob времени объекта управления, которая выбирается несколько
большее чем To ;
 постоянные Tp1 ,Tp2 времени интегрирующей цепи, которые в отличии от






классического решения [7], выбираются из двух значений в зависимости от
начальной фазы переходного процесса замкнутой системы. Предварительно, на
этапе синтеза значения Tp1 ,Tp2 вычисляются в соответствии с аппроксимирующими
функциями.
Рис. 2. Поведение переменных состояния замкнутой системы (3).
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
476
Для пояснения необходимости аппроксимирующих функций рассмотрим численное решение системы уравнений (3), представленное в виде соответствующих переходных процессов (рис. 2). На основе анализа переходных процессов в системе предлагается формулировать условия выбора Tp1 ,Tp2 в виде утверждения.
Утверждение. Если замкнутая система (3) имеет начальное состояние соответствующее x1 = x2 = C1, x3 = 0 и параметры объекта To ,ku являются стационарными в рам-
ках одного переходного процесса, то существуют такие значения Tp1 ,Tp2 , при которых
решение системы (3) позволяет получить оптимальное по быстродействию управление
u  t  объектом второго порядка на основе принципа максимума Понтрягина.
Доказательство утверждения: используется теорема о количестве переключений
управления по принципу максимума [9], где для объекта второго порядка формируются
два воздействия, которые скачкообразно изменяются в конкретной точке фазового пространства. Из рис. 2 следует, что моменты времени, соответствующие точке переключения, однозначно определяются для заданных начальных условий. Динамические параметры обратной связи Tp1 ,Tp2 представляются в виде многопараметрических функ-
ций:
(4)
Tp1  C1,To ,ku  ,Tp2  C1,To ,ku  .
В аналитическом виде эти функции получить чрезвычайно сложно, поэтому предлагается использовать их аппроксимацию:
Cmax = kcmx  Tо  ku
(5)

C  1
Tp2 =  k p20 + k p21  max   ,
C1  ku


C 
Tp1 =  k p10 + k p11  1   Tp2
Cmax 

где k p20 ,k p21 ,k p10 ,k p11 – коэффициенты, полученные в процессе аппроксимации. В част-
ности для объекта с параметрами ku = 0.74,To = 30сек коэффициенты аппроксимации
соответствуют kcmx = 4.49,k p10 = 1.28,k p11 = 6.55,k p20 = 3.6 ,k p21 = 0.057 и обеспечивают
точность вычисления не хуже 10% в диапазоне изменения параметров объекта
ku   0.521.04  ,To   21.2 42.4  . Следует отметить, что поиск наиболее удачных аппроксимирующих функций остается открытой задачей для дальнейшего развития метода.
3.2. Численный эксперимент на исходной модели объекта
Для сравнительной оценки качества предлагаемого релейного управления было использовано оптимальное управление линеаризованной системой в точке равновесия
модели (1) объекта с коэффициентами регулятора, определенными в результате решения матричного уравнения Риккати. При этом предполагается, что все переменные состояния доступны для измерения. Программа вычисления и моделирования процессов
выполнена в виде скрипта SciLab и доступна на Internet ресурсе [11]. Приняты следующие значения параметров исходной модели объекта:
Tпр = 120,Tсм = 11,Ttob = 1,Tбк = 25,Tхв = 1,kmx = 0.9,kh = 1.2 ,ktob = 1,K ost = 0.22 ,n = 1,m = 6 ,
для которых вычислены соответствующие параметры объекта второго порядка:
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
477
ku = 0.063,To = 25,τ z = 17.5 , необходимые для получения функций (5). На рис. 3 представлены результаты моделирования релейного метода (сплошными линиями) и оптимального управления, полученного на основе решения уравнения Рикати (пунктирные
линии).
Рис. 3. Моделирование релейного управления без учета запаздывания.
В результате анализа установлено, что, несмотря на неполное соответствие модели
второго порядка управление (красная линия) имеет четко выраженные два управляющих воздействия с моментом переключения в начале переходного процесса. Такое
управление позволяет уже к моменту времени в окрестности 185 с. перевести регулируемую переменную (черная линия) в заданный диапазон значений, при этом время регулирования составляет 290 секунд. В промежутке времени от 200 с. до 400 с. наблюдаются импульсы, порожденные скользящим режимом, компенсирующие влияние обратного теплоносителя (синяя линия).
3.3. Система со значительным запаздыванием
При рассмотрении задачи управления температурой обратного теплоносителя (пе
ременная состояния Т об1
) можно предположить, что длительность запаздывания будет
значительно превышать время инерции объекта управления. Здесь, как правило, в качестве регулятора применяется предиктор Смита, способы реализации которого известны
и доступны во многих ПЛК. Разностное уравнение регулятора на базе предиктора Смита, которое используется при моделировании рассматриваемого объекта, приведено на
Internet ресурсе [11].
Для корректного функционирования релейного элемента в системе со значительным запаздыванием в алгоритм регулятора вводится эквивалентная математическая
модель второго порядка, соответствующая выражению (2). В результате система дифференциальных уравнений с программно-логическими элементами регулятора представляется выражениями:
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
478
1


x
=
  xm2  xm1 
m1

Tmо

1

u = sign  xm3  xm1 
 xm2 = T  u, где u = if   xm3  xm1  > δ 

п
m


elseif   xm3  xm1   u1   0 u = 0



u = u1
else

 x = if  u = 0 
 xm3
 m3 
Tmо



if sign  xm1  t   u  t   < 0
u


Tp1  C1,Tmо ,Tmп 



if sign  x  t   u  t   > 0
u

m1

Tp2  C1,Tmо ,Tmп 



1
 xm4 = if  bstat = bw 


(6)
,
τ z + 3  Tmо


if  b  b  0; x = 0;

m4
stat
w


bend
bstat = if  xm4  1



if bstat = bend    x1  > δ  bw ;C1 = x1m = x2m = x1 ; xm4 = 0


bstat
else

где эквивалентная (эталонная модель) представлена переменными xm1 ,xm2 , обратную
связь релейного элемента отражает переменная xm3 , переменная xm4 – нормированный
счетчик времени переходного процесса. Переменная bstat характеризует функционально-логическое состояние регулятора.
Приняты следующие значения параметров исходной модели объекта:
Tпр = 150,Tсм = 11,Ttob = 15,Tбк = 24,Tхв = 1,kmx = 0.9 ,kh = 1.2 ,ktob = 0.94 ,








K ost = 0.28,n = 2,m = 12,kc1 = 0.45,kc2 = 0.55,τ1 = 350,τ 2 = 500
на основании которых вычислены соответствующие параметры модели объекта второго порядка:
ku = 0.15,To = 24,τ z = 30 .
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
479
Рис. 4. Моделирование релейного управления для объекта со значительным запаздыванием.
На рис. 4 приведены результаты моделирования, где сплошной линией обозначены
переходные процессы в релейном управлении, пунктирной линией — процесс с использованием предиктора Смита. По результатам моделирования можно сделать следующее заключение: алгоритм обеспечивает оптимальное управление объектом, стабилизируя регулируемую переменную в заданной области и компенсируя возмущения в
виде транспортного запаздывания.
Очевидно, неточное управление порождает переходной процесс в окрестности 2000
с. Особенно яркие преимущества по сравнению с предиктором Смита отсутствуют, в
связи с тем, что температура обратного теплоносителя влияет на температуру подающего теплоносителя, что отражено во втором уравнении модели (1). По этой причине
потребовалось увеличить время ожидания процессов транспортного запаздывания примерно в 4 раза.
Для сравнительной оценки предлагаемого подхода с известными методами рассматривается оптимальное управление на основе решения уравнения Риккати при ста
билизации температуры Т об1
теплоносителя в обратном контуре. На рис. 5 приведены
результаты моделирования оптимального управления для полностью наблюдаемой модели объекта (пунктирные линии), из которого следует, что время регулирования может быть гораздо меньше значения 1150 с. по сравнению со значением 1700 с. на рис. 4.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
480
Рис. 5. Моделирование релейного управления по температуре подающего теплоносителя
для объекта со значительным запаздыванием.
Логичным решением может быть использование более быстродействующего замк
нутого контура с обратной связью по переменной Т пд3
, стабилизация которой в устано
вившемся режиме обеспечит заданное значение переменой Т об1
. Из исходной математической модели можно получить статические зависимости в установившемся режиме,
которые соответствуют следующим уравнениям:



Tпд2
=  ktob  Tпд1
+ 1  ktob   Tоб2





Tоб1
=  ktob  Tоб2
+ 1  ktob   Tпд1




.
Tпд3 = Tпд2
 


Tob3 = Tпд3  1  kост  + kост  Tком
T  = T   1  k  + k  T 
об3
хв
хв
хв
 об2

Из данных уравнений можно однозначно выразить зависимость Tпд3
Tоб1  в виде:



2
ktob  Tоб1
+ ktob
 kост  Tком
 1  ktob   kост  Tком
2
(7)

пд3
T
=
1  k
2
tob   1  ktob   1  kост  + ktob  1  kост  
2
.

Для рассматриваемого случая, когда требуется стабилизировать Tоб1
= 50С , вычис
ленное значение будет равно Tпд3
= 59.2C . На рис. 5 даны результаты моделирования
управления с релейным элементом (сплошные линии), где в качестве задания по контуру подающего теплоносителя использовался задатчик (7). В результате качество переходных процессов оказалось несколько лучше, чем управление с полностью наблюдаемым объектом.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.
481
4. Заключение
Регулятор с релейным элементом, охваченным сложной обратной связью с элементами программно-логических правил, достаточно просто реализуется на недорогих
микропроцессорах. Обоснованный выбор параметров такой обратной связи позволяет
при стационарных условиях придать регулятору свойства оптимального по быстродействию управления, построенного по принципу максимума Понтрягина. Кроме того, организация скользящего режима обеспечивает робастность в условиях нестационарности
параметров объекта. Таким образом, полученный алгоритм имеет преимущества перед
оптимальными линейными системами регулирования и не использует производную от
измеряемого сигнала, что весьма важно для ПЛК с АЦП небольшой разрядностью. Результаты моделирования подтверждают преимущество предлагаемого подхода синтеза
регулятора по быстродействию, особенно в системах со значительным запаздыванием.
К недостаткам данного метода управления можно отнести некоторые проблемы
теоретического характера: сложность определения аналитической зависимости параметров обратной связи от параметров объекта (4), аппроксимация (5) обеспечивает точность вычисления в узком диапазоне, не определены строгие доказательства устойчивости. Однако анализ результатов моделирования и экспериментальных исследований
подтверждает, что такие решения существуют и этот факт является основой для дальнейшего развития прикладной теории управления.
Работа выполнена при финансовой поддержке РФФИ (проект 13-08-01015_р).
Список литературы
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Ротач В.Я. Интервальные итерационные алгоритмы адаптации ПИД регуляторов // Автоматизация в
промышленности. 2007. № 9. С. 3-6.
Шилин А.А., Букреев В.Г., Койков К.И. Математическая модель нелинейной теплообменной системы с запаздыванием // Приборы и системы. Управление, контроль, диагностика. 2013. № 6. С. 15-22.
Уткин В.И. Скользящие режимы в задачах оптимизации и управления. М.: Наука, 1981. 367 с.
Isidori A. Nonlinear control systems. Berlin: Springer, 1995. 549 c.
Шилин А.А., Букреев В.Г. Динамическое определение траектории скольжения при релейном управлении нелинейным объектом // Проблемы управления. 2013. № 5. С. 22-28.
Цыпкин Я.3. Релейные автоматические системы. М.: Наука, 1974. 576 с.
Клюев А.С., Лебедев А.Т., Клюев С.А., Товарнов А.Г. Наладка средств автоматизации и автоматических систем регулирования. Справочное пособие под ред. А.С. Клюева / 2-е изд. перераб. и доп. М.:
Энергоатомиздат, 1989. 368 с.
Шилин А.А., В.Г. Букреев Нелинейная математическая модель теплопотребления с учетом характеристик элементов теплового узла // Научный вестник НГТУ. 2012. № 2 (47). С. 107-114.
Методы классической и современной теории автоматического управления: Т. 4. Теория оптимизации
систем автоматического управления / Под. ред К.А.Пупкова и Н.Д.Егупова. М.: Издательство МГТУ
им. Н.Э.Баумана, 2004. 744 с.
Шилин А.А., Букреев В.Г. Исследование трехпозиционного релейного регулятора температуры в
скользящем режиме работы // Доклады ТУСУР. 2012. № 1 (25). Часть 2. С. 251-257.
Шилин А.А. Материалы и приложение к статье. http://portal.tpu.ru/SHARED/s/SHILIN/tethiss/Tab4.
XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ
ВСПУ-2014
Москва 16-19 июня 2014 г.