close

Вход

Забыли?

вход по аккаунту

- Вестник Пермского университета. Математика

код для вставкиСкачать
ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА
Математика. Механика. Информатика
2014
Вып. 3(26)
МЕХАНИКА
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 519.7
Решение задачи предельного быстродействия
управления движением плоского двухзвенного
манипулятора
Л. В. Куксенок, С. В. Лутманов
Пермский государственный национальный исследовательский университет
Россия, 614990, Пермь, ул. Букирева, 15
[email protected]; (342) 239-63-09
Строится и исследуется математическая модель плоского двухзвенного манипулятора с
двумя вращательными кинематическими парами. В предположении, что в начальный момент схват манипулятора не лежит на базовой траектории, решается задача об оптимальном
(в смысле предельного быстродействия) возращении его на указанную траекторию.
Ключевые слова: манипулятор; математическая модель; оптимальное управление; предельное быстродействие.
Введение
нию трансцендентного уравнения, а построение оптимального управления – к решению
задачи математического программирования
специального вида.
Задачи теории оптимального управления нелинейными динамическими объектами
и в частности задача предельного быстродействия являются весьма трудными для решения. В статье исследуется возможность сведения задачи о возвращении схвата манипулятора на базовую траекторию наибыстрейшим
образом к задаче предельного быстродействия
по приведению фазового вектора линеаризованной модели манипулятора в начало координат. Такое сведение обосновывается тем,
что возмущение траектории схвата, возникающее вследствие малых отклонений начального положения схвата от его базового
положения, является малым. Указанный подход позволил применить методы теории оптимального управления линейными динамическими системами к решению задачи наибыстрейшего возвращения схвата на базовую
траекторию. В частности, определение оптимального времени перехода свелось к реше-
1. Математическая модель
манипулятора
В работах [3, 4] была построена математическая модель плоского горизонтального
двухзвенного манипулятора (рис. 1). Каждое
Y
O2
O1
1
X
Рис. 1
© Куксенок Л. В., Лутманов С. В., 2014
28
2
Решение задачи предельного быстродействия управления движением … манипулятора
звено манипулятора представляет собой абсолютно жесткий однородный стержень длиной
l1  l2  l и массой mi , i  1, 2 .
Первое звено соединено с неподвижным основанием вращательной парой O1 , а со
X  X  t  , Y  Y  t  , t  [t0 , T ] , а также программные управления
vi  vi  t  t  [t0 , T ], i  1, 2 ,
реализующие указанный закон движения. При
этом движение схвата происходит по заданной (базовой) траектории Y  F  X  , а в мо-
вторым звеном – вращательной парой O2 .
Принимается, что масса схвата манипулятора
– m. В соединительных парах могут развиваться управляющие вращательные моменты,
соответственно v1 и v2 . На горизонтальной
плоскости, в которой расположен манипулятор, введем прямолинейную ось O1 X . Обо-
менты времени t0 и T схват имеет нулевую
скорость. В предположении, что в начальный
момент времени схват был смещен относительно базовой траектории и что это смещение невелико, в указанных выше работах была решена задача о возращении схвата на базовую траекторию до момента окончания
процесса T с помощью дополнительных
управлений u1    , u2    . При этом в работе
значим через  i угол, образованный i -м звеном манипулятора, i  1, 2 , с осью O1 X . Трение в шарнирах отсутствует. Дифференциальные уравнения движения манипулятора, записанные в форме уравнений Лагранжа второго
рода, имеют вид
[3] управления u1    , u2    были оптимальны
в смысле критерия
1
q1  q3 ,
q2  q4 ,
T 2
2
2
I [v()]     u1 ( )  u2 ( )  d  , (1.2)
 t0

bv1  bcq42 sin(q1  q2 )
q3 

ab  c 2 cos 2 (q1  q2 )
cv2 cos(q1  q2 )


ab  c 2 cos2  q1  q2 
1 c 2 q32 sin[2(q1  q2 )]
 
,
2 ab  c 2 cos 2 (q1  q2 )
а в работе [4] – в смысле критерия
I [u ()]  vrai max
u12 ( )  u22 ( ) .

В книге [1] критерий (1.2) носит название "минимум энергии", а критерий (1.3) –
"минимум силы". Решение задач было осуществлено с использованием линеаризованной
системы дифференциальных уравнений движения схвата в окрестности базового закона
движения (линеаризованная модель). Оно
свелось к задаче перевода фазового вектора
системы в начало координат. Сама же линеаризованная система имела вид
(1.1)
2
3
av2  acq sin(q1  q2 )

ab  c 2 cos2 (q1  q2 )
cv1 cos(q1  q2 )


ab  c 2 cos2 (q1  q2 )
q4 
(1.3)
 [ t0 ,t ]
1 c 2 q42 sin[2(q1  q2 )]
 
,
2 ab  c 2 cos 2 (q1  q2 )
x  A(t ) x  B(t )u ,
(1.4)
где
где
1 4
1 4
a  ( m1  4m2  4m)l 2 , b  ( m2  4m)l 2 ,
4 3
4 3
1
c  (2m  m2 )l 2 .
2
q1  1 , q2   2 , q3  1 , q4   2 .
A(t ) 
 0

 0
 Q
 3
 q1
 Q4

 q1
Считаются заданными начальный t0 и
конечный T моменты времени процесса, кинематический закон движения схвата в декартовых координатах
29
Q (t , q, u )

q
*
*
q  q ( t ), v  v ( t )
0
0
Q3
q2
1
0
Q3
q3
Q4
q2
Q4
q3
0 

1 
Q3 
,

q4 
Q4 

q4  q  q* (t ),v v* (t )
Л. В. Куксенок, С. В. Лутманов
B (t ) 
av2  acq32 sin(q1  q2 )

ab  c 2 cos2 (q1  q2 )
cv1 cos(q1  q2 )


ab  c 2 cos2 (q1  q2 )
Q (t , q, u )

v
q  q* ( t ), v  v* ( t )
 0
 0

 Q
 3
 v1
 Q4

 v1
q4 
0 
0 
Q3 
,

v2 
Q4 

v2  q q* ( t ), v v* (t )
1 c 2 q42 sin[2(q1  q2 )]
 
,
2 ab  c 2 cos 2 (q1  q2 )
с соответствующими начальными условиями.
2. Задача предельного
быстродействия
 Q1 
 
Q2
Q    , Q1  q3 , Q2  q4 ,
 Q3 
 
 Q4 
В настоящей работе на основе приведенной выше математической модели манипулятора решается задача возвращения схвата
на базовую траекторию за наименьшее время
с использованием дополнительного управления u () . Относительно управляющих параметров u предполагается, что они стеснены
геометрическими ограничениями
bv1  bcq42 sin(q1  q2 )

ab  c 2 cos2 (q1  q2 )
cv2 cos(q1  q2 )


ab  c 2 cos2  q1  q2 
Q3 
 u 

u  P   1   R 2 u12  u 22   2  .
 u 2 

1 c 2 q32 sin[2(q1  q2 )]
 
,
2 ab  c 2 cos 2 (q1  q2 )
Следуя статье [2], опишем алгоритм построения оптимального по быстродействию
управления для системы (1.4). Для начального
av2  acq32 sin(q1  q2 )

ab  c 2 cos2 (q1  q2 )
cv1 cos(q1  q2 )


ab  c 2 cos2 (q1  q2 )
положения t , x   t0 , T   R полагаем
4
Q4 

  t , x, T   max 0, max
X ' T , t  l , x 
4

  min X ' T ,  l , B   u d  . (2.1)
uP
t

 l1 

 

4
  l2 

 4
4
2
Здесь S  
 R  li  1 ,
i 1
 l3 

  l4 



X t ,   фундаментальная матрица Коши
1 c 2 q42 sin[2(q1  q2 )]
 
2 ab  c 2 cos 2 (q1  q2 ) ,
а q* :[t0 , T ]  R 2  закон изменения вектора
обобщенных координат манипулятора, отвечающий базовому кинематическому закону
движения схвата. Движение реального механизма можно получить, проинтегрировав систему дифференциальных уравнений
для однородной системы дифференциальных
уравнений x  A(t ) x. Функция  называется
гипотетическим рассогласованием. Ее геометрический смысл состоит в том, что величина   t , x, T  представляет собой расстояние
q1  q3 ,
q2  q4 ,
q3 
b  v1  t   u10  t    bcq42 sin(q1  q2 )
ab  c 2 cos 2 (q1  q2 )

c  v  t   u  t   cos(q1  q2 )

2
0
2
ab  c 2 cos2  q1  q2 
1 c 2 q32 sin[2(q1  q2 )]
 
,
2 ab  c 2 cos 2 (q1  q2 )
lS
T

от области достижимости динамического объекта из начальной позиции  t , x  в конечный

момент времени T до начала координат. Известно [5], что в области   t , x, T   0 максимум в правой части равенства (2.1) достигается на единственном векторе l 0  t , x, T   S  4  ,
(1.5)
30
Решение задачи предельного быстродействия управления движением … манипулятора
функция гипотетического рассогласования
является непрерывно дифференцируемой
функцией аргументов  t , x  , а ее частные
производные вычисляются по формулам
На полуинтервале  0 , 1  управление u
 0
B t  u, s 0 ,
 t , x    A  t  x, s 0  min
u

P
t
 0
t, x   s0 ,
x
0
где
s  X ' T , t  l 0  t , x, T  .
ных уравнений (1.5), где в качестве дополни-

строится так, как это описано выше. Пусть
x  0  t   решение системы дифференциальтельного управления применяется u
Далее полагается x
1
 lim x 
  1
0
0
0
 .
  . На полу-
интервале  0 , 1  управление u
1
 
строит-
 , с той лишь разницей,
Допустимое программное управление
0
u    , переводящее фазовый вектор в ту точ-
ся так же, как u
ку области достижимости, расстояние от которой
до
начала
координат
равно
  t , x, T   0 , удовлетворяет условию
рется позиция  1 , x
что в качестве начальной позиции здесь бе-

1
 и т. д.
3. Численный эксперимент
Принимаем, что массово-геометрические характеристики манипулятора, а также
время процесса, кинематический закон движения схвата и его начальное смещение совпадают с аналогичными параметрами из статей [3], [4]. Тогда
s, B  t  u 0  t   min s 0 , B  t  u ,
uP
t  t 0 , T  .
0
(2.2)
Решение задачи быстродействия сводится к построению монотонно возрастающей
последовательности
Tk  , T1  t0 , k  1, 2, ,   t , x, Tk   0 ,
т  m1  m2  1кг, l1  l2  1 м, t0  0, Т  1сек,
1
Y  cos X  1,   0, 000001сек,
4
x1 (0)  1, 21 101 рад, x2 (0)  0.53 101 рад ,
рад
рад
x3 (0)  0
, x4 (0)  0
.
сек
сек
удовлетворяющей условию  Tk   0 . При
вычислении значений  Tk  , k  1, 2, по
формуле (2.1) приходится решать задачу математического программирования максимизации строго вогнутой, положительно однородной функции на единичной сфере. Данная задача осложнена наличием определенных интегралов в выражении для целевой функции,
которые не берутся аналитически. При практической реализации алгоритма процесс построения
членов
последовательности
Tk  , k  1, 2, следует остановить, когда
Ограничение на управление имеет вид
 u 

u 
u   1   P   1   R 2 u12  u12  5 .
 u 2 

u2 
В принятых предположениях решается
задача быстродействия по алгоритму, описанному в пункте 2. Величина гипотетического
рассогласования здесь вычисляется по формуле
удается подобрать такое число T , для кото-
 [0, x[0], T ]  max  X [T , 0]x0 , l 
рого  T   0 и T  Tk   , где   0 па-
l 1
раметр точности. В этом случае T  Tk , T  ,
0
T

  min[u11 ( , l )  u2 2 ( , l )]d  
uP
0

 max  X [T , 0]x0 , l 
а за оптимальное программное управление
принимается функция u 0    , найденная из
условия (2.2).
0
Время перехода T можно улучшить,
если применить позиционную процедуру
управления. С этой целью промежуток  t0 , T 
l 1
T

5 12 ( , l )   22 ( , l ) d  ,
0

где выражения 1 ( , l ), 2 ( , l ) представляют
разбивается на полуинтервалы
собой известные функции элементов фундаментальной матрицы Коши X T ,  .
i ,i1  , i  0,1,, k,  0  t0 ,  k  T , i1 i   .
31
Л. В. Куксенок, С. В. Лутманов
Построим последовательность
Tk  ,
0
В момент времени Т  0.417924 разности между решением системы со смещенными начальными условиями и базовыми законами движения составляют соответственно
T1  t0 , k  1, 2,  ,   t , x, Tk   0 .
Имеем Т 1  0 , Т 2  0.1 ,…,
q1 (T 0 )  0,54 102 рад, q2 (T 0 )  0,27 102 рад
рад
рад
q3 (T 0 )  3,3102
, q4 (T 0 )  1,04 102
сек
сек .
Т k  2  0.4179239 , Т k 1  0.417924 ,
Т k  0.4179241 , где Т k  2  Т k   . Тогда
0
оптимальное время перехода Т  0.417924.
Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле


1 ( , l 0 )


2
0
2
0

(

,
l
)


(

,
l
)


,
1
2
u 0 (t )  U (t , l 0 , T 0 )  5 

0
2 ( , l )


  2 ( , l 0 )   2 ( , l 0 ) 
2
 1

t  [t 0 , T 0 ] .
В момент времени t  1 эта разность составляет
q1 (1)  0, 22 102 рад, q2 (1)  0, 24 10 2 рад ,
рад
рад
, q4 (1)  0, 2  10 2
сек
сек .
Далее решается задача быстродействия
по схеме позиционного управления. В таблице приведены результаты решений задач быстродействия на различных участках разбиения промежутка  t0 , T  .
q3 (1)  0,32 10 2
(3.1)
Эффективность найденного дополнительного программного управления (3.1) проверяется путем подстановки его в исходные
нелинейные дифференциальные уравнения
движения (1.5) и интегрирования их с выбранными смещенными начальными условиями. Численно показано, что в результате
0
схват в момент времени Т выходит на базовую траекторию и продолжает движение
вдоль нее после выключения дополнительных
управлений.
На рис. 2 приводится базовая траектория движения схвата манипулятора и его траектория, полученная в результате решения задачи быстродействия в классе программных
управлений.
Оптимальное время перехода при позиционном управлении
[ i ; i 1 )
Т0
[0;0,1)
[0,1;0,2)
[0,2;0,3)
[0,3;0,416011)
0,417924
0,417457
0,416732
0,416011
На рис.3 представлены траектории движения схвата манипулятора, получающиеся в
результате позиционного управления манипулятором.
Рис. 3. Траектория движения схвата: 1 –
движение схвата после его возвращения на
базовую траекторию; 2 – оптимальная
траектория схвата, отвечающая времени
перевода Т 0  0.416011; 3 – базовая траектория движения схвата
Рис. 2. Траектория движения схвата: 1 –
движение схвата после его возвращения на
базовую траекторию; 2 – оптимальная
траектория схвата, отвечающая времени
перевода Т 0  0.417924; 3 – базовая траектория движения схвата
32
Решение задачи предельного быстродействия управления движением … манипулятора
торию, а время перехода при этом меньше,
чем в случае программного управления.
0
В момент времени Т  0.416011 разности между решением системы со смещенными начальными условиями и базовыми законами движения составляют соответственно
0
4
0
Список литературы
4
х1 (T )  0,38  10 рад, х 2 (T )  0,12  10 рад ,
х 3 (T 0 )  4,48  10 3
1. Красовский Н.Н. Теория управления движением. М.: Наука, 1968. 476 с.
2. Лутманов С.В., Стрелкова Н.А. Оптимальное по быстродействию управление поступательным перемещением твердого тела //
Вестник Пермского университета. Сер.
Математика. Механика. Информатика.
2010. Вып.1 (1). С.50–57.
3. Куксенок Л.В., Лутманов С.В. Управление
движением плоского двухзвенного манипулятора по критерию "минимум энергии"
// Проблемы механики и управления: межвуз. cб. науч. тр. Пермь, 2012. С. 33–41.
4. Куксенок Л.В., Лутманов С.В. Управление
движением плоского двухзвенного манипулятора по критерию "минимум силы" //
Проблемы механики и управления: межвуз. сб. науч. тр. Пермь, 2013. Вып. 45. С.
20–29.
5. Лутманов С.В. Вариационное исчисление и
теория оптимального управления в примерах и упражнениях: учеб. пособие / Перм.
гос. ун-т. Пермь, 2010. 200 с.
рад
рад
, х 4 (T 0 )  7,35  10 3
сек
сек .
В момент времени t  1 эта разность
составляет
х1 (1)  0,25  10 3 рад, х 2 (1)  0,11  10 3 рад ,
х 3 (1)  0,93  103
рад
рад
, х 4 (1)  0,18  103
сек
сек .
Заключение
В статье показано, что программное
управление, решающее задачу предельного
быстродействия для линеаризованной модели,
приемлемо для решения задачи о наибыстрейшем возвращении схвата манипулятора на
базовую траекторию. Сравнивая качество
программного и позиционного управлений,
построенных в работе, можно отметить, что
при позиционном управлении схват с большей точностью попадает на заданную траек-
Solution of task of maximum fast-acting of
control by motion of the flat double-hinged arm
L. V. Kuksyonok, S. V. Lutmanov
Perm State University, Russia, 614990, Perm, Bukirev st., 15
[email protected]; (342) 239 63 09
The mathematical model of the flat double-hinged arm is built and investigated with two rotatory
kinematics pairs. In supposition, that in initial moment the gripper of manipulator does not lie on a
base trajectory, a task decides about optimal in sense of maximum fast-acting of return him on the
indicated trajectory.
Key words: manipulator; mathematical model; optimal control; maximum fast-acting.
33
1/--страниц
Пожаловаться на содержимое документа