Professional Documents
Culture Documents
Ky Thuat Dieu Khien Da Bien PDF
Ky Thuat Dieu Khien Da Bien PDF
u1 y1
G1
u2 y2
G2
1
Hình 2: Hệ MIMO nhiều chiều
Gọi hàm truyền của hệ này là G thì ta có thể viết
y1 G11u1 G12u2
Hay (1.2)
y2 G21u1 G22u2
Hệ MIMO như trên còn có thể được gọi là hệ nhiều chiều (đan xen nhau) hay hệ đa biến
(mutivariable system). Biến ở đây được hiểu là biến vào và ra để tránh nhầm lẫn với biến
trạng thái mà vốn một hệ SISO cũng có thể có nhiều (đa biến trạng thái).
Nhìn vào (1.2) ta có thể thấy trong trường hợp này hàm truyền không còn là một hàm đơn
giản nữa mà là một ma trận các hàm truyền. Tuy nhiên, ta cũng phải chú ý rằng phương
trình (1.1) cũng có thể được viết dưới dạng ma trận như sau
(1.3)
Phương trình (1.3) khác với phương trình (1.2) ở chỗ: nó là ma trận đường chéo, các phần
tử nằm ngoài đường chéo chính đều bằng 0.
Nói cách khác, nếu ta có thể thiết kế được một khâu bù có tác dụng "khử" các mối liên hệ
đan chéo giữa các kênh thì hệ MIMO lại trở thành nhiều hệ SISO bình thường. Khi đó ta
nói rằng hệ đã được cách ly hay phân ly (decoupling). Một bộ điều khiển làm được việc
như vậy thì cũng được gọi là điều khiển phân ly hay cách ly (decoupling control).
Hàm truyền có thể coi là "độ khuyếch đại" giữa đầu vào và đầu ra (tất nhiên độ khuyếch
đại này còn phụ thuộc vào tần số nữa).
Với hệ SISO, nếu độ khuyếch đại này bằng 1 trong dải tần làm việc (bandwidth) thì y = u
và ta nói hệ điều khiển như thế là điều khiển "bám" (tracking control), ngoài ra độ
khuyếch đại này có thể bằng một giá trị vô hướng nào đó ở một tần số xác định.
Với hệ MIMO: Hàm truyền được đặc trưng bởi một ma trận hàm truyền. Vậy thì "độ lớn"
của ma trận là thế nào? Lấy cái gì ra để đo "độ lớn" của ma trận bây giờ? Đây cũng chính
là điều thú vị khi ta nghiên cứu các khái niệm mới về hệ MIMO so với hệ SISO.
2
Một trong những yêu cầu về chất lượng của một hệ điều khiển là tính ổn định bền vững
chống lại sự tác động của nhiễu và sự sai lệch của mô hình toán học của đối tượng cần
điều khiển.
Nếu chưa kể đến tác động của nhiễu và giả sử ta có một đối tượng G với mô hình toán
học là H. Thông thường H không thể phản ánh được đầy đủ các tính chất của G, hay nói
cách khác giữa H và G luôn tồn tại một sai lệch:
(1.4)
Trong đó là thành phần không chắc chắn với giả thiết
(1.5)
Và từ đây mọi câu chuyện về điều khiển bền vững sẽ xoay quanh giá trị này. Liệu hệ
thống với bộ điều khiển thiết kế cho G còn ổn định hay không với sự có mặt của ? Làm
thế nào lôi ra khỏi G? Làm thế nào để thiết kế một bộ điều khiển ổn định cho H, mặc
cho thay đổi trong khuôn khổ (1.5) đó? Toolbox nào trong Matlab chuyên dùng để điều
khiển cho những đối tượng như vậy?
1.1.2 Phương trình trạng thái
CÊu tróc chung
Tr¹ng th¸i cña hÖ thèng lµ g×? T¹i sao ta ph¶i quan t©m?
VÝ dô ®iÒu khiÓn ®éng c¬. Bªn c¹nh tÝn hiÖu ra cña ®éng c¬ lµ tèc ®é ta cßn cÇn quan t©m
®Õn nh÷ng th«ng sè thay ®æi kh¸c cña ®éng c¬ trong khi tÝnh to¸n thiÕt kÕ bé ®iÒu khiÓn
nh gia tèc ®éng c¬, møc ®é tæn hao n¨ng lîng... hay trong ®iÒu khiÓn cÇn cÈu th× bªn
c¹nh qu·ng ®êng mµ hµng ®îc cÈu cßn ph¶i quan t©m ®Õn tèc ®é vËn chuyÓn hµng, ®é
l¾c cña hµng ®îc vËn chuyÓn....
Cã g× kh¸c biÖt gi÷a tr¹ng th¸i víi tÝn hiÖu ra cña hÖ thèng? T¹i sao kh«ng xem tr¹ng th¸i
nh nh÷ng tÝn hiÖu ra cña ®îc bæ xung thªm?
BiÕn tr¹ng th¸i ph¶i ®îc hiÓu réng h¬n kh¸i niÖm tÝn hiÖu ra. NÕu lµ tÝn hiÖu ra th× ngêi
ta ph¶i trùc tiÕp ®o ®îc nã (nhê c¸c c¶m biÕn) cßn ë biÕn tr¹ng th¸i th× kh«ng nh vËy,
ngêi ta chØ x¸c ®Þnh ®îc mét sè biÕn tr¹ng th¸i th«ng qua c¸c tÝn hiÖu ®o ®îc kh¸c.
XÐt 1 hÖ thèng cã cÊu tróc:
u1 HÖ thèng kü y1
... thuËt ...
x1,x2,...,xn
Um yr
4
dx1 dx dx
x2 ; 2 x3 ,....., n1 xn (1.11)
dt dt dt
Cïng víi (1.5) ta cã thªm:
dxn d n y
n a0 x1 a1 x2 ...... an1 xn u (1.12)
dt dt
ViÕt chung (1.11) vµ (1.12) víi nhau díi d¹ng ma trËn ®îc:
dx1 0 1 0 .... 0 0
x
dt 1
...... ... .. ... .... ... ...
... ... u
0 0 0 1 0
dx1 xn
- a 2 .... - a n-1 1
dt - a 0 - a 1
Còng nh:
x1
y x1 1 0 .... 0 ....
xn
ViÕt l¹i hÖ ph¬ng tr×nh trªn vÒ d¹ng (1.6) sÏ cã:
dx1 0 1 0 .... 0 0
x1 dt
dx ...... ... .. ... .... ... ...
x ... ; ... ; A ; B ;
dt
0 0 0 1 0
xn dx1
- a - a - a 2 .... - a n-1 1
dt 0 1
C 1 0 ... 0 ; D 0
1.2. Ma trËn c¸c hµm truyÒn ®¹t
1.2.1 Nh¾c l¹i vÒ ®¹i sè ma trËn
1.2.1.1 C¸c phÐp tÝnh víi ma trËn
- PhÐp céng/ trõ
Cho 2 ma trËn A = (aÞj) vµ B = (bij) cã cïng m hµng n cét. Tæng hay hiÖu cña chóng ®îc
ký hiÖu lµ A B = (aij bij)
- PhÐp nh©n víi sè thùc (phøc)
Cho ma trËn A = (aij) cã m hµng n cét vµ 1 sè v« híng thùc (phøc) x tuú ý. TÝch xA ®îc
hiÓu lµ ma trËn xA = (xaij) vµ Ax ®îc hiÓu lµ Ax = (aij). HiÓn nhiªn cã Ax = xA.
- PhÐp chuyÓn vÞ
5
Ma trËn chuyÓn vÞ cña ma trËn A = (aij) cã m hµng n cét lµ ma trËn AT = (aji) cã n hµng m
cét ®îc t¹o tõ A qua viÖc ho¸n chuyÓn hµng thµnh cét vµ cét thµnh hµng. Ta lu«n cã
(AT)T = A.
- PhÐp nh©n 2 ma trËn
Cho ma trËn A = (aik)mxp vµ ma trËn B = (bkj)pxn. TÝch AB = C = (cij)mxn
TÝnh chÊt :
(AB)T = BTAT
A(B + C) = AB + AC vµ (A + B)C = AC + BC
A = AI = IA víi I lµ ma trËn ®¬n vÞ
1.3.1.2 H¹ng cña ma trËn
XÐt ma trËn A = (aij), i = 1,2,...,m ; j = 1,2, ..., n bÊt kú (cã kiÓu mxn)
vµ gäi hi víi i = 1,2,...,m lµ c¸c vÐc t¬ hµng còng nh cj, j = 1,2,...n lµ c¸c vÐc t¬ cét cña A.
Nõu trong sè m vÐc t¬ hµng hi cã nhiÒu nhÊt p m vÐct¬ ®éc lËp tuyÕn tÝnh vµ trong sè m
vÐc t¬ cét cj cã nhiÒu nhÊt q n vÐct¬ ®éc lËp tuyÕn tÝnh th× h¹ng cña ma trËn ®îc hiÓu
lµ :
Rank(A) = min{p,q}
Mét ma trËn vu«ng A(aij)nxn gäi lµ kh«ng suy biÕn nÕu Rank(A) = n;
nÕu Rank(A) n th× A ®îc gäi lµ ma trËn suy biÕn
TÝnh chÊt:
Rank(A) = p = q
Rank(AB) Rank(A) vµ Rank(AB) Rank(B)
Rank(AB) Rank(A) + Rank(B)
NÕu A kh«ng suy biÕn th× Rank(AB) = Rank(B)
NÕu A thuéc kiÓu (mxn) víi m n vµ Rank(A) = m th× tÝch AAT lµ ma trËn vu«ng kiÓu
(mxm) kh«ng suy biÕn víi Rank(A) = m
1.3.1.3 §Þnh thøc cña ma trËn
det(A) = det(AT)
det(AB) = det(A).det(B)
1.3.1.4 Ma trËn nghÞch ®¶o
Cho ma trËn A = (aij), i = 1,2,...,m ; j = 1,2,...,n trong ®ã aij lµ nh÷ng sè thùc (phøc). NÕu
tån t¹i ma trËn B tho¶ m·n :
AB =BA = I
th× ma trËn B ®îc gäi lµ ma trËn nghÞch ®¶o cña A vµ ký hiÖu lµ B = A-1
TÝnh chÊt:
(AB)-1 = B-1A-1 vµ (A-1)T = (AT)-1 q1 q2
NÕu A = diag(ai) vµ kh«ng suy biÕn th× V V
-1 -1
A = diag((ai) )
Aadj
A 1 víi ma trËn bï Aadj lµ ma trËn
H
det A H
~ (1) i j det A
cã c¸c phÇn tö a ij ji S S
Vµ Aji lµ ma trËn thu ®îc tõ A b»ng c¸ch bá
®i hµng thø j vµ cét thø i (phÇn tö ë vÞ trÝ ®èi g1 q1 g2
xøng víi a~ )
ij
H×nh 1.3 VÝ dô 1.3.2.1
6
1.2.2 Ma trËn c¸c hµm truyÒn ®¹t
1.2.2.1 VÝ dô
Cho ®èi tîng cã cÊu tróc MIMO 2 ®Çu vµo u1 vµ u2 cïng 2 ®Çu ra y1, y2 nh h×nh 1.2 cña
2 b×nh th«ng nhau.
§¹i lîng ®iÒu khiÓn ®èi tîng lµ lu lîng q1 vµ q2 ë 2 ®Çu vµo. §¹i lîng ®îc ®iÒu
khiÓn lµ mùc níc H1, H2. Lu lîng níc ch¶y ra khái b×nh lµ g1, g2 cßn lu lîng th«ng
nhau gi÷a 2 b×nh lµ q12. Hai b×nh cã tiÕt diÖn kh«ng ®æi S1 vµ S2.
§èi tîng ®îc m« t¶ bëi 2 ph¬ng tr×nh sau:
S1dH1
q1 g1 q12
dt
(1.8)
S1dH1
q2 g 2 q12
dt
Lu lîng th«ng nhau gi÷a 2 b×nh q12 = q12(H1-H2) nãi
chung lµ 1 hµm phi tuyÕn tÝnh. g1, g2 ®ãng vai trß lµ u1 y1
nhiÔu. V× lîng ra y1 = H1 vµ y2 = H2 lµ 2 ®¹i lîng cã
liªn hÖ nhau vµ phô thuéc c¶ 2 tÝn hiÖu ®iÒu khiÓn ®èi u2 y2
tîng u1 q1 ; u2 q2 nªn ®ã lµ ®èi tîng cã nhiÒu mèi
liªn hÖ nh ë h×nh 1.3 H×nh 1.3
Díi d¹ng to¸n tö, ®èi tîng ®îc m« t¶ bëi hÖ
ph¬ng tr×nh :
Y1 G11u1 G12u 2 Y1
u1 G11
(1.9)
Y2 G21u1 G22u 2
HoÆc díi d¹ng vÐct¬ : G12
Y = G.U trong ®ã :
Y1 u1 G11 G12 G21
Y ; U ; G
Y2 u 2 G 21 G22 U2 Y2
G22
S¬ ®å t¬ng ®¬ng nh h×nh 1.4
Ngoµi ra c¸c hÖ thuû lùc, nh÷ng ®èi tîng nhiÒu ®Çu
vµo vµ ra cßn gÆp ë c¸c hÖ ®iÒu hoµ nhiÖt ®é vµ ®é H×nh 1.4
Èm kh«ng khÝ, hÖ ®iÒu chØnh tèc ®é vµ ¸p suÊt tuabin,
c¸c hÖ ®iÒu chØnh nhiÖt ®é vµ møc cña c¸c cét chng cÊt...
1.2.2.2 Ma trËn hµm truyÒn ®¹t
Ma trËn cña c¸c hµm truyÒn ®¹t hay ma trËn hµm truyÒn ®¹t ®îc x¸c ®Þnh theo ph¬ng
tr×nh tr¹ng th¸i. BiÕn ®æi Laplace cña vÐct¬ lµ biÕn ®æi Laplace cña c¸c thµnh phÇn:
Lx1 X 1 ( s ) Lx1
X ( s ) Lxt ........ ........ ; Lx t ........
Lx X ( s ) Lx
n n n
Mµ Lx t sX i ( s ) xi (0) , do ®ã:
7
X AX Bu (1.10)
Cã: sX(s) x0 = A.X(s) + B.U(s) (1.11)
(sI A)X(s) = B.U(s) + x0 (1.12)
§¸p øng tr¹ng th¸i X(s) víi ®iÒu kiÖn duy nhÊt U(s) = 0 vµ ®¸p øng ra víi ®iÒu kiÖn ®Çu vµ
tÝn hiÖu vµo cã d¹ng:
X(s) = (s.I – A)-1x0; (1.13)
Y(s) = G(s)U(s) + C(sI – A)-1x0 (1.14)
Ma trËn hµm truyÒn sÏ lµ:
G(s) = C(sI – A)-1B (1.15)
Ma trËn liªn hÖ gi÷a ®Çu vµo vµ ®Çu ra theo Laplace víi ®iÒu kiÖn ®Çu b»ng 0.
ë biÓu thøc (1.14) thµnh phÇn thø nhÊt lµ ®¸p øng ®aïa vµo víi x0 = 0 vµ thµnh phÇn thø 2
lµ ®¸p øng ®Çu ra víi ®iÒu kiÖn ®Çu u = 0.
Víi hÖ r ®Çu vµo vµ m ®Çu ra ta cã :
Y1 ( s ) G1 ( s ).........G1r ( s ) u1 ( s )
........ .......... .......... ........ ; ........
Yi ( s ) Yi1 ( s ) ..... Yir ( s ); Yij ( s ) Gij ( s)U j ( s )
Y ( s ) G ( s ).......G ( s ) u ( s )
m m1 mr r VÝ dô:
Víi hÖ 2 vµo 2 ra:
r1 u1 y1 K1 0
r ; u ; y ; K ;
r2 u 2 y 2 0 K 2
1 5
s 1 s5
G (s)
0,4 4
s 0,5 s 2
§Ó hÖ æn ®Þnh , mäi nghiÖm tõ hµm truyÒn ®¹t ®Òu lµ nghiÖm tr¸i.
NghÞch ®¶o cña (sI – A) b»ng ma trËn liªn hîp chia cho ®Þnh thøc t¬ng øng nªn:
adj ( s.I A) B
G (s) C D (1.16)
s.I A
r u y
K G(s)
–
H×nh 1.5
8
Ch¬ng II TÝnh æn ®Þnh vµ chÊt lîng cña hÖ ®a biÕn
2.1 TÝnh æn ®Þnh cña hÖ ®a biÕn
§Þnh lý vÒ æn ®Þnh
HÖ ®îc m« t¶ bëi ph¬ng tr×nh tr¹ng th¸i:
d X
dt X A X Bu
Y C X Du
æn ®Þnh khi vµ chØ khi c¸c gi¸ trÞ riªng cña ma trËn hay nghiÖm cña ph¬ng tr×nh ®Æc trng
s.I A 0 ®Òu n»m ë nöa tr¸i cña mÆt ph¼ng s.
0 1 1
C 1 0; A ; B
- 2 - 3 0
s -1
1 1 s 3 1
sI A ; sI - A 2
- 2 s 3 s 3s 2 - 2 s
[1 0] s 3 1 1 s3
W(s) C ( sI A) 1 B
(s 1)(s 2) - 2
s 0 ( s 1)( s 2)
sI A s 2 3s 2
Giá trị riêng là – 1 và – 2 nên hệ ổn định
1 0 0 1 1 0
C ; A ; B
1 1 2 3 0 2
s 1 1 1 s 3 1
sI A ; sIA 2
2 s 3 s 3s 2 2 s
1 0 s 3 2
1 1 s 3 1 1 0 s 1 (s 2)
W(s) C ( sI A) 1 B
(s 1)(s 2) 2 s 0 2 ( s 1)( s 2)
sI A s 2 3s 2
Giá trị riêng là – 1 và – 2 nên hệ ổn định
2.2 Tiªu chuÈn chÊt lîng cña hÖ ®a biÕn
2.2.1 Ph©n tÝch tÝnh æn ®Þnh BIBO
+ Kh¸i niÖm æn ®Þnh BIBO
Mét hÖ thèng ®îc gäi lµ æn ®Þnh khi kÝch thÝch hÖ b»ng tÝn hiÖu u(t) bÞ chÆn ë ®Çu vµo,
th× hÖ sÏ cã ®¸p øng y(t) ë ®Çu ra còng bÞ chÆn. Kh¸i niÖm æn ®Þnh nµy thêng ®îc gäi lµ
æn ®Þnh BIBO (Bound Inputs – Bound Outputs).
+ Tríc hÕt tõ mèi quan hÖ gi÷a m« h×nh tr¹ng th¸i
9
d X
dt X A X Bu
(2.1)
Y C X Du
Vµ ma trËn hµm truyÒn ®¹t G(s) cña hÖ thèng:
adj ( s.I A) B
G ( s ) C ( sI A)1 B D C D
s.I A
Ta thÊy ngay ®îc r»ng gi¸ trÞ riªng cña ma trËn A trong m« h×nh 1.17 chÝnh lµ ®iÓm cùc
cña hÖ thèng.
2.2.2 §Þnh lý 2.2.2
HÖ (1.17) æn ®Þnh BIBO khi vµ chØ khi ma trËn A cã tÊt c¶ c¸c gi¸ trÞ riªng n»m bªn tr¸i
trôc ¶o tøc lµ khi vµ chØ khi
p ( s ) det s.I A (2.2)
lµ ®a thøc Hurwitz. Hay nãi c¸ch kh¸c lµ nghiÖm cña ph¬ng tr×nh ®Æc trng s.I A 0
®Òu n»m ë nöa tr¸i cña mÆt ph¼ng s.
Nh vËy c¸c tiªu chuÈn ®· biÕt nh Routh, Hurwitz, Michailov, Lienard_Chipart... ®Òu sö
dông ®îc ®Ó kiÓm tra tÝnh æn ®Þnh cña hÖ (1.17). VÊn ®Ò h¹n chÕ lµ khi ma trËn A cã sè
chiÒu kh¸ lín. Khi ®ã viÖc x©y dùng ®a thøc ®Æc tÝnh p ( s ) det s.I A gÆp khã kh¨n.
2.2.3 §Þnh lý Gerchgorin vµ hÖ qu¶
Ph¸t biÓu ®Þnh lý:
Víi mçi gi¸ trÞ riªng sk cña ma trËn phøc (c¸c phÇn tö lµ nh÷ng sè phøc):
a11 a 12 ... a 1n
j
a 21 a 22 ... a 2n
A
...................... Ri
aii
σ
a a ... a
n1 n2 nn
lu«n tån t¹imét chØ sè i = 1,2,...,n sao cho sk n»m trong ®êng trßn t©m aii b¸n kÝnh Ri, víi
Ri = |ai1| + ... + |aii-1| + |aii+1| + ... + |ain| tøc lµ:
n
s k aii Ri aij (2.3)
j 1
j i
Chøng minh:
v1
V× sk lµ gi¸ trÞ riªng cña A nªn ph¶i tån t¹i mét vector v ... 0 sao cho:
vn
(A skI ) v = 0
Trong ®ã 0 lµ ký hiÖu chØ vector cã c¸c phÇn tö ®Òu b»ng 0
10
Suy ra:
n n
aij v j aii sk vi 0 aii sk vi aij v j
j 1 j 1
j i j i
Víi i = 1,2,...,n, chän 1 chØ sè i sao cho:
| vi | = max{|v1|, |v2|, ..., |vn|}
sÏ cã:
n n n
s k aii vi aij v j aij . vi sk aii aij (®.p.c.m)
j 1 j 1 j 1
j i j i j i
Theo ®Þnh lý nµy, mçi gi¸ trÞ riªng s icña A ®Òu ®îc bao bëi 1 ®êng trßn cã t©m lµ aii vµ
b¸n kÝnh Ri , i = 1, 2, ..., n. Do ®ã nÕu nh c¸c ®êng trßn ®ã ®Òu n»m bªn tr¸i trôc ¶o th×
ch¾c ch¾n tÊt c¶ c¸c gi¸ trÞ riªng si i = 1,...., n ®Òu ph¶i cã phÇn thùc ©m.
HÖ qu¶ ®Þnh lý Gerchgorin
n
Ký hiÖu Ri aij .
j 1
j i
Khi ®ã hÖ (1.17) víi aij ε R sÏ æn ®Þnh nÕu aii + Ri 0 víi mäi i = 1,..,n
VÝ dô minh ho¹
Cho hÖ m« t¶ bëi:
3 -1 0 1
dX
2 - 3 0 X 0 u
dt
- 2 1 - 4 1
Tõ ma trËn hÖ thèng cã:
a11 + R1 =– 3 + 1 = – 2 < 0
a22 + R2 =– 3 + 2 = – 1 < 0
a33 + R3 =– 4 +(2 + 1) = – 1 < 0
Do ®ã theo hÖ qu¶ ®Þnh lý Gerchogorin th× hÖ æn ®Þnh
Ta cã thÓ kiÓm tra l¹i nhê ®a thøc ®Æc tÝnh cña hÖ thèng: p(s) = det (sI - A)
§Þnh lý Gerchgorin vµ hÖ qu¶ cña nã sÏ lµ 1 tiªu chuÈn bæ xung , gióp ta xÐt ®îc tÝnh æn
®Þnh cña hÖ (2.1) mµ kh«ng cÇn ®Õn ®a thøc ®Æc tÝnh (2.2)
2.2.4 Tính bền vững của hệ bất định có cấu trúc: Tiêu chuẩn Kharitonov
Cho 1 lớp mô hình đối tượng tuyến tính có cấu trúc:
1 b1s ... bm s m B( s)
G(s) n
(2.4)
a0 a1s ... an s A( s)
trong đó các tham số bi, i = 0, 1, ..., m và ak, k = 0, 1, ..., n là các tham số bất định
đối tượng bất định được mô tả bởi (2.4) sẽ ổn định khi và chỉ khi G(s) là một hàm bề tức
là khi và chỉ khi
A(s) = a0 + a1s + ansn (2.5)
là đa thức Hurwitz với mọi giá trị tham số ak, k = 0, 1, ..., n.
11
Đa thức A(s) cho trong (1.21) được gọi là đa thức Hurwitz chặt (strictly Hurwitz) nếu nó
là đa thức Hurwitz với mọi giá trị tham số ak thuộc khoảng
ak ak ak k = 0, 1, ..., n. (2.6)
2.3 TÝnh bÒn v÷ng cña hÖ ®a biÕn vÒ æn ®Þnh vµ chÊt lîng
2.3.1 Định lý Kharitonov
Để đa thức A(s) cho trong (2.5) là Hurwitz chặt thì cần và đủ là cả 4 đa thức hệ số hằng
sau đây (được gọi là các đa thức Kharitonov):
K1 a0 a1 s a2 s 2 a3 s 3 a4 s 4 a5 s 5 a6 s 6 ....
K ( j ) a
3
0 a2 2 a4 4 a6 6 ... j a a
1
3
3
a5 5 ...
K ( j ) a
4
0 a2 2 a4 4 a6 6 ... j a a
1
3
3
a5 5 ...
Ta đi đến:
ReK1 j ReK 2 j Re A j ReK 3 j ReK 4 j
12
j K2(j) K3(j)
K1(j) K4(j)
+1
Điều này chỉ ra rằng với 1 giá trị cố định, hàm A(j) có giá trị nằm trong hình chữ
nhật với 4 đỉnh là các giá trị của 4 đa thức Kharitonov.
13
Chương III: Điều khiển LQG đa biến
3.1 Điều khiển đa biến
3.1.1 Phương pháp biến phân
Biến phân là một phương pháp được xây dựng từ điều kiện cần phải có của nghiệm tối ưu
u(t) của bài toán tối ưu động, liên tục có khoảng thời gian T xác định, cho trước và không
bị ràng buộc bởi điều kiện U, hoặc nếu có bị ràng buộc thì tập U của các vector tín hiệu
điều khiển thích hợp phải là một tập hở.
Ý tưởng chính của biến phân có thể tóm tắt như sau:
Từ giả thiết u(t) là tín hiệu điều khiển tối ưu, x(t) là quỹ đạo trạng thái tối ưu, người ta
xây dựng một tín hiệu điều khiển khác có 1 sai lệch nhỏ so với nó là:
u~ (t ) u (t ) u (t ) trong đó u t rất nhỏ (3.1)
và xem u~ (t ) chưa phải là tín hiệu tối ưu.
Tiếp theo, người ta giả thiết quỹ đạo trạng thái ~x (t ) do u~ (t ) tạo ra cho hệ thống cũng
chỉ có 1 sai lệch rấtnhỏ so với quỹ đạo trạng thái tối ưu x(t), tức là:
~
x (t ) x(t ) x (t ) cũng có x t rất nhỏ (3.2)
Từ điều kiện phải có của tín hiệu điều khiển tối ưu:
Q( x, u ) Q( ~ x , u~) (3.3)
người ta xác định tính chất của điều khiển tối ưu u(t), gọi là tính chất biến phân.
3.1.2 Hàm Hamilton, phương trình Euler – Lagrange và điều kiện cần
Xét bài toán tối ưu động, liên tục có diểm đầu xo và thời gian cố định T cho trước:
d x
dt f x, u , x 0 x (0) (3.4)
T
Q( x, u ) g ( x, u )dt min (3.5)
0
Giả sử u(t) là nghiệm tối ưu của bài toán liên tục và x(t) là quỹ đạo trạng thái tối ưu tương
ứng. u~ (t ) là vector tín hiệu điều khiển được biến phân từ u(t) theo công thức (3.1) và
~
x (t ) là quỹ đạo trạng thái tương ứng của nó thoả mãn điều kiện biến phân (3.2). Khi đó
ta có (3.3).
x(t) x(t) S(T)
x(T)=0
x(T)0
x(t) ~
x (t )
~ o
x (t ) x0
x0
Điểm đầu và điểm cuối cố định Điểm đầu cố định điểm cuối ràng buộc
14
nếu x(T) là không cố định (vd bị ràng buộc) thì có thể có x(T) 0.
Sau cùng 1 khoảng thời gian T không đổi ta sẽ có:
T
Q( ~
x , u~) g x x .u u dt Qu, x Q 0
Q
0
Bởi vậy từ bất đẳng thức (3.3) và bằng tích phân chuỗi Taylor ta sẽ xấp xỉ được thành:
T g g
0 Q Q( ~
x , u~) Qu, x x u dt (3.6)
0 x u
Trong đó:
g g g g g g g g
, ,..., ; , ,..., là các ký hiệu ma trận Jacobi của
x x1 x2 xn u u1 u 2 un
hàm nhiều biến g(x, u)
Hoàn toàn tương tự, từ mô hình trạng thái (3.4) của hệ ta cũng có:
dx
f x, u và
d x
x f x , u u
dt dt x u
d df df
dt
x u
x f x , u u f x, u
dx
x
du u
d df df d x d f df
x x T
u 0 p x u 0 (3.7)
dt dx du dt dx du
trong đó pT là một véctor n chiều tuỳ ý.
f1 f1 f1 f1
.... ....
x1 x n u1 u m
df df
.................... ; .................... là các ma trận Jacobi của vector hàm
dx du
n f f f f
n n n
x .... x u .... u
1 n 1 n
f(x,u).
Kết hợp chung (3.6) và (3.7) lại ta có :
T g g T d x d f df
0 Q x u p x u dt
x u dt d x d u
0
áp dụng tích phân toàn phần ta được:
15
T g f d pT d f d g
T
0 Q p (T ) x (T ) p T u p T x dt
0 u u
dt dx dx
(3.8)
vì x = 0 do điểm đầu x0 là điểm xác định cho trước (hình) nhưng do vector p(T) là vector
bất kỳ nên có thể chọn:
d pT df dg
pT
T
với điều kiện biên: p (T ) x (T ) = 0
dt dx dx
Khi đó p(T) được gọi là vector đồng trạng thái (costate) đồng thời bất đẳng thức (3.8) trử
thành:
T g f
0 Q pT u dt (3.9)
0 u u
Cuối cùng sử dụng ký hiệu hàm Hamilton:
H(x, u, p) = pTf(x, u) – g(x, u) (3.10)
Ta sẽ được phương trình Euler Lagrange như sau:
T T
d x H dp H T
; với p (T ) x (T ) (3.11)
dt p dt x
Và công thức biến phân bậc nhất hàm mục tiêu trở thành:
T H
0 Q u dt (3.12)
0 u
Định lý: (điều kiện cần)
Nếu u(t) là nghiệm của bài toán tối ưu động liên tục (3.4), (3.5) có điểm đầu x0 và khoảng
thời gian T cho trước thì nghiệm đó phải thoả mãn:
H x, u, p T
0 (3.13)
u
trong đó H(x,u,p) là hàm Hamilton xác định theo công thức (3.10) và vector p(t) là
nghiệm của phương trình Euler Lagrange (3.11) ứng với u(t), x(t) tối ưu
Phương pháp tìm nghiệm tối ưu của bài toán (3.4), (3.5) có điểm đầu x0 = x(0) và khoảng
thời gian T cố định, cho trước, bằng cách thực hiện lần lượt các bước sau:
Lập hàm Hamilton (3.10)
Giải phương trình vi phân (3.13) để có quan hệ u(x,p)
Thay quan hệ vừa tìm được vào (3.11) để được hệ phương trình vi phân cho các
(vector) biến x và p
Giải hệ phương trình có từ bước trên với các điều kiện biên x(0) = x0 và x(T) = xT
T
hoặc p (T ) x (T ) = 0 để có nghiệm x(t) và p(t)trong đó:
16
a. Nếu điểm cuối x(T) = xT là tự do (hoặc bị ràng buộc), tức là khi có x (T ) 0 thì
phải có p(T)= 0. Đây chính là bài toán tối ưu có điểm trạng thái đầu cố định, điểm
trạng thái cuối tự do hoặc bị ràng buộc.
b. Nếu cho trước điểm cuối x(T) = xT thì p(T) là tuỳ ý, vì đã có x (T ) 0 . đây chính
là bài toán tối ưu có điểm trạng thái đầu, cuối cố định và T cho trước.
Thay nghiệm x(T), p(t) tìm được ở bước 4 vào quan hệ u(x,p) đã có từ bước 2 hoặc
trực tiếp vào mô hình (3.4) cảu hệthống để có nghiệm u(t) tối ưu.
Ví dụ
Cho hệ có mô hình:
dx 1 1
x u hãy tìm u*(t) đưa hệ đi từ điểm đầu x(0) = 4 đến điểm cuối x(4) = 0 và
dt 2 2
4
làm cho: Q( x, u ) x 2 u 2 dt min
0
nhận xét:
Đây là bài toán tối ưu động, liên tục, không ràng buộc. có điểm đầu, điểm cuối cố định và
khoảng thời gian T = 4 cho trước.
Áp dụng phương pháp biến phân, ta có:
1 1
x u x2 u2
Lập hàm Hamilton H ( x, u , p ) p
2 2
H 1
Xác định quan hệ u(x,p) từ 0 được u p
u 4
Thay quan hệ tìm được vào phương trình EulerLagrange (3.11) ta được hệ phương
trình:
1 1
d x 2 8 x
dt p
2 1 p
2
A
Giải hệ phương trình vi phân trên được:
x k1e s1 k 2 e s2
p k3e s1 k 4 e s2
trong đó s1, s2 là những giá trị riêng của ma trận A, tức là nghiệm của: det(sI – A) = 0
1 1
s1 ; s2
2 2
các hệ số k1, k2 được xác định từ điều kiện biên x(0) = 4 và x(4) = 0 như sau:
17
k1 k 2 4 k1 0,014 t
t
2 2
x(t ) 0,014e 4,014e
k1e 2 2 k 2 e 2 2
0 k 2 4,014
Thay x(t) tìm được vào mô hình của hệ đã cho được u(t) tối ưu:
t t
2 2
u (t ) 0,034e 1,663e
3.1.3 Phương trình vi phân Riccati. và bộ điều khiển tối ưu tĩnh phản hồi trạng thái
cho đối tượng tuyến tính (trường hợp thời gian vô hạn)
Phương trình vi phân Riccati có dạng:
dK
C AT K KA KBD 1 B T K (3.14)
dt
Phương trình này là phương trình phi tuyến có nhiều nghiệm, nên để xác định được
nghiệm nào thoả mãn bài toán tối ưu ta phải xét các tính chất cơ bản phải có của ma
trận K:
Định lý:
Ma trận K(t) của bài toán tối ưu có các tính chất sau:
a. K(T) = trong đó là ký hiệu của ma trận chỉ có các phần tử bằng 0.
b. K(t) phụ thuộc T và khi T → thì K(t) →K là một ma trận hằng (hình 3.2)
KT
T t
0
T
K tăng
Hình 3.2 minh hoạ định lý
18
Xác định vector tín hiệu điều khiển u(t) tối ưu, tuỳ ý, nhưng cho trước, tới 1 điểm trạng
thái x bất kỳ nào đó của không gian trạng thái Rn trong khoảng thời gian vô cùng lớn
(T = ), sao cho trong quá trình chuyển đổi trạng thái đó chi phí tính theo phiếm hàm
mục tiêu 3.15b đạt giá trịn nhỏ nhất Qmin
3.2.2 Lời giải bài toán 3.15 Bộ điều khiển tối ưu phản hồi dương
nghiệm tối ưu u(t) của bài toán (3.15) có dạng :
u = D-1BTK x (3.16)
trong đó K lim K (t ) là ma trận hằng, đối xứng và xác định bán âm.
T
dK
Từ phương trình vi phân Riccati (3.14) với ta suy ra ma trận hằng K phải là
dt
nghiệm xác định bán âm của phương trình đại số Riccati :
K BD 1 B T K AT K KA C (3.17)
Với tín hiệu điều khiển tối ưu u(t) xác định theo (3.16), (3.17) hàm mục tiêu sẽ đạt giá
trị nhỏ nhất Qmin và giá trị đó được tính bằng :
1 T
Qmin x 0 K x 0
2
Tín hiệu tối ưu (3.16) có thể được tạo ra bởi bộ điều khiển tĩnh R, phản hồi dương trạng
thái gọi là bộ điều khiển LQR (Linear Quadratic Regulatior) :
R = D-1BTK (3.18)
khi đó hệ kín bao gồm đối tượng (3.15a) và bộ điều khiển (3.18) sẽ có mô hình :
dx
( A BR) x Bu (3.19)
dt
Tuy điểm cuối x là bất kỳ nhưng để hàm mục tiêu Q(x,u) có giá trị hữu hạn Qmin thì
T
T
hàm dưới dấu tích phân của nó phải thoả mãn : lim x C x u Du 0 tức là 2 giá trị
t
T T
x lim x và u lim u phải thoả mãn :
t t
T T
x C x 0; u Du 0
Nhưng vì C xác định bán dương, D xác định dương, nên cuối cùng phải có :
a. u = 0
T
b. x phải là điểm cân bằng của hệ kín (3.19) và thoả mãn x C x 0 . như vậy
chắc chắn sẽ có x = 0 nếu (A + BR) không suy biến hoặc C xác định dương.
c. Khi C xác định dương hoặc ma trận (A+BR) không suy biến thì do chắc chắn có
x = 0 với mọi x0 nên bộ điều khiển tối ưu R sẽ làm ổn định hệ kín. Nói cách khác,
khi bị nhiễu tức thời đánh bật ra khỏi điểm cân bằng gốc toạ độ 0 thì bộ điều khiển R
sẽ đưa hệ quay trở lại 0 và hơn thế, chi phí cho quá trình quay về đó tính theo (3.15b)
là nhỏ nhất.
19
=0 u dx x
A x Bu
dt
R D 1 B T K
Bộ điều khiển tối ưu tĩnh, phản hồi trạng
thái dương
Ví dụ :
Cho đối tượng có mô hình trạng thái
d x 0 0 1
x u
dt 1 0 0
và hàm mục tiêu :
1 T 5 0
Qmin x x u 2 dt min
2 0 0 4
Như vậy : ta có A, B, C, D. Do đối tượng có 2 biến trạng thái (n = 2) nên nghiệm K
của phương trình đại số Riccati phải là ma trận (2x2). Ngoài ra, vì K là ma trận đối
k1 k3
xứng giốngnhư C, D nên nó có dạng K . Thay các giá trị A, B, C, D
k3 k 2
vào (3.17) ta được :
k12 2k3 5 0
k12 k 1k3 k3 k 2 k3 0 5 0
k 2 4 0
3
2 0 0
k1k3 k 3 0 0 k 2 4
k1k3 k 2 0
Hệ phương trình trên có các nghiệm sau :
a. k3 = 2 ; k1 = 1 ; k2 = –2
b. k3 = 2 ; k1 = – 1 ; k2 = 2
c. k3 = – 2 ; k1 = 3 ; k2 = 6
d. k3 = – 2 ; k1 = – 3 ; k2 = – 6
chỉ có nghiệm d. mới làm cho K xác định bán âm tức là ma trận có giá trị riêng với
phần thựckhông dương. Bởi vậy :
2 3
K và bộ điều khiển tối ưu, phản hồi dương sẽ là :
3 6
20
2 3
R D 1 B T K 1 0 (3 2)
3 6
3.2.3 Bộ điều khiển tối ưu phản hồi âm
Phương pháp xác định bộ điều khiển tối ưu tĩnh, phản hồi dương trạng thái với ma trận
K là nghiệm xác định bán âm của phương trình đại số Riccati (3.17) cũng được áp dụng
khi bộ điều khiển là phản hồi âm, bằng cách trong phương trình đại số (3.17) ta thay K
bởi K = L. khi đó ta sẽ đi đến các bước thiết kế sau :
1. Tìm nghiệm L xác định bán dương của phương trình đại số Riccati :
L BD 1 B T L AT L LA C (3.20)
2. Xác định bộ điều khiển phản hồi âm, cũng được gọi là bộ điều khiển LQR (Linear
Quadratic Regulator) :
R = D1BTL (3.21)
Chú ý : Giống như ở bài toán phản hồi dương hoặc ma trận (A – BR) của hệ kín (hình
dưới) không suy biến thì chắc chắn điểm trạng thái cuối sẽ là x = 0 với mọi x0 và do đó
bộ điều khiển tối ưu (3.21) sẽ làm hệ ổn định
=0 u dx x
A x Bu
_ dt
R D 1 B T L
Bộ điều khiển tối ưu tĩnh, phản hồi (âm)
trạng thái
Ví dụ :
Cho bài toán tối ưu :
d x 0 3 1
x u
dt 1 0 0
và hàm mục tiêu :
1
Qmin
16 x22 u 2 dt min
20
21
l1 l3
Như vậy : ta có A, B, C, D. Thay các giá trị trên và ma trận L vào (3.21)
l3 l 2
ta
l1 l3 1 l1 l3 l1 l3 0 3 0 3 l1 l3 0 0
1 0
l3 l2 0 l3 l 2 l3 l2 1 0 1 0 l3 l2 0 16
22
gian hữu hạn T thoả mãn (3.22). Nếu hằng ssô T còn được chọn tuỳ ý miễn rằng T > t0 thì
hệ được gọi là quan sát được hoàn toàn.
n x (t )
n y (t )
d x
u dt f ( x, u ) n x (t ) y
y
y g ( x) n y (t )
~
x Bộ quan sát
trạng thái
23
d x
dt A( x ) B (u ) n x
(3.25)
y Cx ny
Trong đó A, B, C là các ma trận hằng, x là vector biến trạng thái, u là vector tín hiệu vào
(tín hiệu điều khiển), y là vector các tín hiệu ra, nx là vector các tín hiệu nhiễu tác động
vào hệ thống và ny là vector các tín hiệu nhiễu tác động ở đầu ra.
Giả thiết nx(t), ny(t )là những vector tín hiệu nhiễu ồn trắng có kỳ vọng bằng 0
khi đó: theo (3.23) bộ quan sát trạng thái cho đối tượng tuyến tính sẽ là:
d~
x u
A x Bu L( y C x ) ( A LC ) x ( B L)
~ ~ ~ (3.26)
dt
y
và nhiệm vụ thiết kế còn lại là xác định ma trận L sao cho có được ~
x (t ) x(t )
~
Lập hàm mô tả sai lệch e(t ) x(t ) x (t ) ta sẽ được:
de d ( x ~
x)
A( x ~
x ) n x L( y C ~
x ) ( Ae n x L(C x n y C ~
x)
dt dt
nx
( A LC )e n x L n y ( A LC )e ( I - L)
A B ny
n
~ ~
Ae B n
I: là ma trận đơn vị.
Để có được ~ x (t ) x (t ) tức là e(t) 0 ta phải tìm L sao cho :
n
T
Q M e e M ei2 min
i 1
sau khi biến đổi ta được :
L = PCTNy-1 (3.27)
Với P là nghiệm xác định bán dương của phương trình Riccati :
PCTNy-1CP –PAT – AP =Nx (3.28)
Ta thấy rõ ràng việc xác định ma trận L cho bộ quan sát trạng thái (3.26) bằng 2 công
thức (3.27), (3.28) chính là bài toán thiết kế bộ điều khiển tối ưu R = LT phản hồi âm
trạng thái cho đối tượng đối ngẫu của (3.25)
d x T T
dt A x C u
(3.29)
1 T
T
QK 2 x N x x u N y u dt min
0
24
Từ đây ta đến được 2 bước xác định bộ quan sát trạng thái tối ưu của Kalman như sau:
1. Giải bài toán tối ưu (3.29) để có được ma trận R=LT là bộ điều khiẻn tối ưu phản
hồi âm trạng thái cho đối tượng (3.29a) theo tiêu chuẩn tối ưu (3.29b). Các ma trận Nx, Ny
được xác định từ nhiễu nx(t), ny(t )trong đó Nx là ma trận xác định bán dương Ny là ma trận
xác định dương.
2. Gán L tìm được vào công thức (3.26) để có hoàn chỉnh mô hình bộ quan sát
trạng thái cho đối tượng (3.25)
Ví dụ:
Thiết kế bộ quan sát trạng thái Kalman:
Cho đối tượng mô tả bởi:
d x 0 1 1
x u n
x
dt 2 0 1
A B
y (0 1) x n y
C
Hãy thiết kế bộ quan sát trạng thái cho đối tượng biết rằng nx, ny là các tín hiệu nhiễu ồn
trắng với:
4 3
Nx và N = 1
y
3 6
Trước hết ta giải bài toán tối ưu
d x 0 2 0
AT x C T u x u
dt
1 0 1
8 6
QK 1 x T x u 2 dt min
2 0 6 9
Áp dụg thuật toán thiết kế bộ điều khiển phản hồi âm trạng thái R = LT đã trình bày ta
được:
T
0 l1 l3
R 11
L trong đó L là nghiệm xác định bán dương của phương trình
1 l3 l 2
Riccati
25
l1 l3 0 l l l l 0 2 0 1 l1 l3 8 6
(0 1) 1 3 1 3
l3 l2 1 l3 l2 l3 l2 1 0 2 0 l3 l2 6 9
l32 - 2l3 8
l 2l3 2l1 l2 6
l 2 4l 9
2 3
Giả hệ phương trình trên và chỉ lấy nghiệm xác định bán dương ta được:
l1 l 3 4 ,5 4
L
l3 l2 4 5
4,5 4 4
suy ra R LT 0 1 ( 4 5) L
4 5 5
Vậy bộ quan sát trạng thái tối ưu của đối tượng đã cho là:
d~
x u 0 - 3 1 4 u
( A LC ) ~
x (B L) ~x
dt
y 2 5 1 5 y
Bộ điều ~
x Bộ quan sát
khiển LQG Kalman
27
Trong đó Nx, Ny là các ma trận hàm tương quan của nhiễu ồn trắng nx(t), ny(t). Cuối cùng
thay L vào công thức (3.23) để được mô hình động của bộ quan sát :
d~
x u
~
( A LC ) x (B L)
dt
y
Ví dụ:
Cho đối tượng mô tả bởi:
d x 1 2 1
x u n
x
dt 3 4 2
A B
y (1 1) x n y
C
Hãy thiết kế bộ điều khiển LQG với
1 0
1 T 1 2
Q x
20
T
20
x u F u dt x1 x 22 u 2 dt min (F = 1)
0 1
E
Trước hết giải bài toán tối ưu tìm RLQR là nghiệm của:
d x 1 2 1
x u
dt
3 4 2
Q 1 x12 x 22 u 2 dt min
20
Áp dụng các bước thuật toán tìm bộ điều khiển tối ưu phản hồi âm trạng thái đã trình bày
ta có được RLQR = (2,73 4,24)
Tiếp theo ta lại tìm LT là bộ điều khiển tối ưu của bài toán
d x 1 2 1
T
A xC u T x u
dt
3 4 2
Q 1 x T N x x u T N y u dt min
20
Với Nx, Ny được chọn là các ma trận phù hợp (Nx = I, Ny = 1)
Lại áp dụng thuật toán như trên ta có :
28
3,27
LT = (3,27 7,72) L
7,72
Vậy bộ điều khiển LQG sẽ bao gồm bộ quan sát trạng thái Kalman :
d~
x u 2,27 - 1,27 1 3,27 u
( A LC ) ~
x (B L) ~x mắc nối tiếp với bộ
dt
y - 4,72 - 3,72 2 7,72 y
điều khiển tĩnh RLQR = (2,73 4,24)
29