Download as pdf or txt
Download as pdf or txt
You are on page 1of 29

§iÒu khiÓn bÒn v÷ng ®a biÕn

Ch­¬ng I BiÓu diÔn hÖ ®a biÕn


1.1 BiÓu diÔn hÖ ®a biÕn b»ng ph­¬ng tr×nh tr¹ng th¸i
1.1.1 Kh¸i niÖm vÒ hÖ ®a biÕn
Lý thuyết điều khiển tự động đã phát triển qua 3 giai đoạn chính.
Giai đoạn 1: Cho đến những năm 1940. Trong giai đoạn này, cơ sở lý thuyết điều khiển tự
động được hình thành. Khi đó, các phương pháp khảo sát hệ “một đầu vào, một đầu ra ­
SISO” như: Hàm truyền và biểu đồ Bode để khảo sát đáp ứng tần số và ổn định; biểu đồ
Nyquist và dự trữ độ lợi/pha để phân tích tính ổn định của hệ kín. Vào cuối những năm
1940 và đầu những năm 1950 phương pháp đồ thị nghiệm của Evans đã được hoàn thiện.
Giai đoạn này được coi là “điều khiển cổ điển”.
Giai đoạn 2: Xung quanh những năm 1960, là giai đoạn phát triển của kỹ thuật điều khiển
được gọi là “điều khiển hiện đại” (Modern Control). Hệ kỹ thuật ngày càng trở nên phức
tạp, có “nhiều đầu vào, nhiều đầu ra ­ MIMO”. Để mô hình hóa hệ thuộc dạng này phải
cần đến tập các phương trình mô tả mối liên quan giữa các trạng thái của hệ. Và phương
pháp điều khiển bằng biến trạng thái được hình thành. Cũng trong thời gian này, lý thuyết
điều khiển tối ưu có những bước phát triển lớn dựa trên nền tảng nguyên lý cực đại của
Pontryagin và lập trình động lực học của Bellman. Đồng thời, lọc Kalman được hoàn
thiện và nhanh chóng trở thành công cụ chuẩn, được sử dụng trong nhiều lĩnh vực để ước
lượng trạng thái bên trong của hệ từ tập nhỏ các tín hiệu đo được.
Giai đoạn 3: Giai đoạn “điều khiển bền vững hệ đa biến”, được bắt đầu từ những năm
1980. ứng dụng những thành tựu của toán học, các nghiên cứu về điều khiển đã đưa ra
được các phương pháp thiết kế bộ điều khiển để một hệ kỹ thuật vẫn đảm bảo được các
tính năng sử dụng khi có tác động của nhiễu và sai số. Trong hai thập kỷ cuối, nhiều
nhánh mới về điều khiển cũng đã hình thành, đó là: thích nghi, phi tuyến, hổn hợp, mờ và
neural.
Chúng ta đều biết rằng hệ MIMO là hệ có nhiều đầu vào và ra. Nhưng điều này cũng có
khi gây hiểu nhầm vì một hệ mà tự bản thân nó là nhiều hệ SISO con thì cũng không
phải là một hệ MIMO đúng nghĩa như ví dụ hệ có hai đầu vào và hai đầu ra như sau:

u1 y1
G1

u2 y2
G2

Hình 1.1: Hệ nhiều vào nhiều ra


nhưng không phải là 1 hệ MIMO đúng nghĩa
Với hệ trên thì rõ ràng các đầu vào ra là độc lập nhau và ta có
 y1  G1u1
 (1.1)
 y2  G2u2
Với một hệ MIMO thực sự thì còn có các tương tác "chéo" giữa các đầu vào và đầu ra.
Xét một hệ nhiều đầu vào ra như sau: (xét hai đầu vào và hai đầu ra cho đơn giản)

1
Hình 2: Hệ MIMO nhiều chiều
Gọi hàm truyền của hệ này là G thì ta có thể viết

 y1  G11u1  G12u2
Hay  (1.2)
 y2  G21u1  G22u2
Hệ MIMO như trên còn có thể được gọi là hệ nhiều chiều (đan xen nhau) hay hệ đa biến
(mutivariable system). Biến ở đây được hiểu là biến vào và ra để tránh nhầm lẫn với biến
trạng thái mà vốn một hệ SISO cũng có thể có nhiều (đa biến trạng thái).
Nhìn vào (1.2) ta có thể thấy trong trường hợp này hàm truyền không còn là một hàm đơn
giản nữa mà là một ma trận các hàm truyền. Tuy nhiên, ta cũng phải chú ý rằng phương
trình (1.1) cũng có thể được viết dưới dạng ma trận như sau

(1.3)
Phương trình (1.3) khác với phương trình (1.2) ở chỗ: nó là ma trận đường chéo, các phần
tử nằm ngoài đường chéo chính đều bằng 0.
Nói cách khác, nếu ta có thể thiết kế được một khâu bù có tác dụng "khử" các mối liên hệ
đan chéo giữa các kênh thì hệ MIMO lại trở thành nhiều hệ SISO bình thường. Khi đó ta
nói rằng hệ đã được cách ly hay phân ly (decoupling). Một bộ điều khiển làm được việc
như vậy thì cũng được gọi là điều khiển phân ly hay cách ly (decoupling control).
Hàm truyền có thể coi là "độ khuyếch đại" giữa đầu vào và đầu ra (tất nhiên độ khuyếch
đại này còn phụ thuộc vào tần số nữa).
Với hệ SISO, nếu độ khuyếch đại này bằng 1 trong dải tần làm việc (bandwidth) thì y = u
và ta nói hệ điều khiển như thế là điều khiển "bám" (tracking control), ngoài ra độ
khuyếch đại này có thể bằng một giá trị vô hướng nào đó ở một tần số xác định.
Với hệ MIMO: Hàm truyền được đặc trưng bởi một ma trận hàm truyền. Vậy thì "độ lớn"
của ma trận là thế nào? Lấy cái gì ra để đo "độ lớn" của ma trận bây giờ? Đây cũng chính
là điều thú vị khi ta nghiên cứu các khái niệm mới về hệ MIMO so với hệ SISO.

2
Một trong những yêu cầu về chất lượng của một hệ điều khiển là tính ổn định bền vững
chống lại sự tác động của nhiễu và sự sai lệch của mô hình toán học của đối tượng cần
điều khiển.
Nếu chưa kể đến tác động của nhiễu và giả sử ta có một đối tượng G với mô hình toán
học là H. Thông thường H không thể phản ánh được đầy đủ các tính chất của G, hay nói
cách khác giữa H và G luôn tồn tại một sai lệch:
(1.4)
Trong đó là thành phần không chắc chắn với giả thiết
(1.5)
Và từ đây mọi câu chuyện về điều khiển bền vững sẽ xoay quanh giá trị này. Liệu hệ
thống với bộ điều khiển thiết kế cho G còn ổn định hay không với sự có mặt của ? Làm
thế nào lôi ra khỏi G? Làm thế nào để thiết kế một bộ điều khiển ổn định cho H, mặc
cho thay đổi trong khuôn khổ (1.5) đó? Toolbox nào trong Matlab chuyên dùng để điều
khiển cho những đối tượng như vậy?
1.1.2 Phương trình trạng thái
CÊu tróc chung
Tr¹ng th¸i cña hÖ thèng lµ g×? T¹i sao ta ph¶i quan t©m?
VÝ dô ®iÒu khiÓn ®éng c¬. Bªn c¹nh tÝn hiÖu ra cña ®éng c¬ lµ tèc ®é ta cßn cÇn quan t©m
®Õn nh÷ng th«ng sè thay ®æi kh¸c cña ®éng c¬ trong khi tÝnh to¸n thiÕt kÕ bé ®iÒu khiÓn
nh­ gia tèc ®éng c¬, møc ®é tæn hao n¨ng l­îng... hay trong ®iÒu khiÓn cÇn cÈu th× bªn
c¹nh qu·ng ®­êng mµ hµng ®­îc cÈu cßn ph¶i quan t©m ®Õn tèc ®é vËn chuyÓn hµng, ®é
l¾c cña hµng ®­îc vËn chuyÓn....
Cã g× kh¸c biÖt gi÷a tr¹ng th¸i víi tÝn hiÖu ra cña hÖ thèng? T¹i sao kh«ng xem tr¹ng th¸i
nh­ nh÷ng tÝn hiÖu ra cña ®­îc bæ xung thªm?
BiÕn tr¹ng th¸i ph¶i ®­îc hiÓu réng h¬n kh¸i niÖm tÝn hiÖu ra. NÕu lµ tÝn hiÖu ra th× ng­êi
ta ph¶i trùc tiÕp ®o ®­îc nã (nhê c¸c c¶m biÕn) cßn ë biÕn tr¹ng th¸i th× kh«ng nh­ vËy,
ng­êi ta chØ x¸c ®Þnh ®­îc mét sè biÕn tr¹ng th¸i th«ng qua c¸c tÝn hiÖu ®o ®­îc kh¸c.
XÐt 1 hÖ thèng cã cÊu tróc:
u1 HÖ thèng kü y1
... thuËt ...
x1,x2,...,xn
Um yr

H×nh 3: M« t¶ 1 hÖ thèng kü thuËt

viÕt chung l¹i lµ vÐct¬ x(t)  Rn


M« h×nh tr¹ng th¸i mµ ta quan t©m ë ®©y lµ lo¹i m« h×nh to¸n häc cã d¹ng:
d x
 dt  A x  Bu
 (1.6)

 y  C x  Du
Trong ®ã: Ma trËn A Rnxn lµ ma trËn hÖ thèng
Ma trËn B Rnxm lµ ma trËn ®iÒu khiÓn
3
Ma trËn C Rrxn vµ D Rrxm lµ c¸c ma trËn ®Çu ra.
Khi A, B, C, D ®Òu lµ c¸c ma trËn h»ng (c¸c phÇn tö ®Òu lµ h»ng sè thùc) th× ta cã m« h×nh
tr¹ng th¸i tham sè h»ng. Ng­îc l¹i ta cã m« h×nh tr¹ng th¸i tham sè biÕn ®æi.
M« h×nh tr¹ng th¸i (1.6) gióp ta kh¶ n¨ng kh¶o s¸t trùc tiÕp ®­îc tr¹ng th¸i cña hÖ thèng
x(t), do ®ã hiÓu kü, hiÓu s©u h¬n b¶n chÊt ®éng häccña hÖ thèng.
Mét c¸ch tæng qu¸t, sau khi ®­a thªm n tÝn hiÖu tr¹ng th¸i x1(t), x2(t), ... xm(t) vµo hÖ
MIMO cã m tÝn hiÖu vµo u1(t), u2(t), ... um(t) vµ r tÝn hiÖu ra y1(t), y2(t), ... yr(t), th× bao giê
hÖ còng m« t¶ ®­îc b»ng ph­¬ng tr×nh tr¹ng th¸i ë 1 trong 3 d¹ng sau:
+ D¹ng tham sè h»ng (1.6)
+ D¹ng tham sè phô thuéc t
d x
 dt  A(t ) x  B (t )u
 (1.7)

 y  C (t ) x  D(t )u
+ D¹ng tham sè r¶i (phô thuéc vÐct¬ tham sè v)
d x
 dt  A(v) x  B (v)u
 (1.8)

 y  C (v) x  D(v)u
Trong ®ã:
 u1   y1   x1   v1 
       
       
u   ...  ; y   ...  ; x   ...  ; v   ...  (1.9)
       
v 
 um   yr   xn   q
1.2 VÝ dô minh häa
1.2.1 X©y dùng m« h×nh tr¹ng th¸i tõ ph­¬ng tr×nh vi ph©n m« t¶ quan hÖ vµo/ ra
XÐt 1 hÖ thèng tuyÕn tÝnh SISO cã 1 tÝn hiÖu vµo u(t) vµ 1 tÝn hiÖu ra lµ y(t).
Gi¶ sö hÖ ®­îc m« t¶ bëi ph­¬ng tr×nh vi ph©n gi÷a tÝn hiÖu vµo vµ tÝn hiÖu ra nh­ sau:
dny d n1 y dy
n
 an1 n1  ...  a1  a0 y  u (t ) (1.10)
dt dt dt
NÕu nh­ bªn c¹nh tÝn hiÖu ra y(t), bµi to¸n thiÕt kÕ ®iÒu khiÓn cña ta cßn cÇn ph¶i ®Ó ý ®Õn
dy d n1 y
nh÷ng sù thay ®æi cña y(t) nh­ ,....., n1 vµ nhÊt lµ sù ¶nh h­ëng cña c¸c gi¸ trÞ ban
dt dt
®Çu cña chóng tíi ®¸p øng y(t) cña hÖ th× c¸c m« h×nh ®· biÐt nh­ hµm truyÒn ®¹t, hµm
qu¸ ®é.... kh«ng cßn ®­îc phï hîp. Ta cÇn tíi mét m« h×nh m« t¶ ®­îc kh«ng riªng quan
hÖ vµo/ ra mµ c¶ nh÷ng thay ®æi ®ã cña tr¹ng th¸i
Ký hiÖu c¸c biÕn tr¹ng th¸i lµ:
dy (t ) d n1 y
x1  y; x2  ,....., xn  n1
dt dt
th×:

4
dx1 dx dx
 x2 ; 2  x3 ,....., n1  xn (1.11)
dt dt dt
Cïng víi (1.5) ta cã thªm:
dxn d n y
 n   a0 x1  a1 x2  ......  an1 xn  u (1.12)
dt dt
ViÕt chung (1.11) vµ (1.12) víi nhau d­íi d¹ng ma trËn ®­îc:
 dx1   0 1 0 .... 0  0 
    x   
 dt    1   
   ...... ... .. ... .... ...    ...
 ...   ...    u
  0 0 0 1    0 
 dx1    xn   
   - a 2 .... - a n-1  1 
 dt   - a 0 - a 1  
Còng nh­:
 x1 
 
 
y  x1  1 0 .... 0  .... 
 
 xn 
ViÕt l¹i hÖ ph­¬ng tr×nh trªn vÒ d¹ng (1.6) sÏ cã:

 dx1  0 1 0 .... 0  0 
     
 x1   dt 
     
  dx    ...... ... .. ... .... ...   ...
x   ... ;   ... ; A ; B   ;
dt 
   0 0 0 1  0 
 xn   dx1     
  - a - a - a 2 .... - a n-1  1 
 dt   0 1  

C  1 0 ... 0 ; D  0
1.2. Ma trËn c¸c hµm truyÒn ®¹t
1.2.1 Nh¾c l¹i vÒ ®¹i sè ma trËn
1.2.1.1 C¸c phÐp tÝnh víi ma trËn
- PhÐp céng/ trõ
Cho 2 ma trËn A = (aÞj) vµ B = (bij) cã cïng m hµng n cét. Tæng hay hiÖu cña chóng ®­îc
ký hiÖu lµ A  B = (aij bij)
- PhÐp nh©n víi sè thùc (phøc)
Cho ma trËn A = (aij) cã m hµng n cét vµ 1 sè v« h­íng thùc (phøc) x tuú ý. TÝch xA ®­îc
hiÓu lµ ma trËn xA = (xaij) vµ Ax ®­îc hiÓu lµ Ax = (aij). HiÓn nhiªn cã Ax = xA.
- PhÐp chuyÓn vÞ

5
Ma trËn chuyÓn vÞ cña ma trËn A = (aij) cã m hµng n cét lµ ma trËn AT = (aji) cã n hµng m
cét ®­îc t¹o tõ A qua viÖc ho¸n chuyÓn hµng thµnh cét vµ cét thµnh hµng. Ta lu«n cã
(AT)T = A.
- PhÐp nh©n 2 ma trËn
Cho ma trËn A = (aik)mxp vµ ma trËn B = (bkj)pxn. TÝch AB = C = (cij)mxn
TÝnh chÊt :
(AB)T = BTAT
A(B + C) = AB + AC vµ (A + B)C = AC + BC
A = AI = IA víi I lµ ma trËn ®¬n vÞ
1.3.1.2 H¹ng cña ma trËn
XÐt ma trËn A = (aij), i = 1,2,...,m ; j = 1,2, ..., n bÊt kú (cã kiÓu mxn)
vµ gäi hi víi i = 1,2,...,m lµ c¸c vÐc t¬ hµng còng nh­ cj, j = 1,2,...n lµ c¸c vÐc t¬ cét cña A.
Nõu trong sè m vÐc t¬ hµng hi cã nhiÒu nhÊt p  m vÐct¬ ®éc lËp tuyÕn tÝnh vµ trong sè m
vÐc t¬ cét cj cã nhiÒu nhÊt q  n vÐct¬ ®éc lËp tuyÕn tÝnh th× h¹ng cña ma trËn ®­îc hiÓu
lµ :
Rank(A) = min{p,q}
Mét ma trËn vu«ng A(aij)nxn gäi lµ kh«ng suy biÕn nÕu Rank(A) = n;
nÕu Rank(A)  n th× A ®­îc gäi lµ ma trËn suy biÕn
TÝnh chÊt:
Rank(A) = p = q
Rank(AB)  Rank(A) vµ Rank(AB)  Rank(B)
Rank(AB)  Rank(A) + Rank(B)
NÕu A kh«ng suy biÕn th× Rank(AB) = Rank(B)
NÕu A thuéc kiÓu (mxn) víi m  n vµ Rank(A) = m th× tÝch AAT lµ ma trËn vu«ng kiÓu
(mxm) kh«ng suy biÕn víi Rank(A) = m
1.3.1.3 §Þnh thøc cña ma trËn
det(A) = det(AT)
det(AB) = det(A).det(B)
1.3.1.4 Ma trËn nghÞch ®¶o
Cho ma trËn A = (aij), i = 1,2,...,m ; j = 1,2,...,n trong ®ã aij lµ nh÷ng sè thùc (phøc). NÕu
tån t¹i ma trËn B tho¶ m·n :
AB =BA = I
th× ma trËn B ®­îc gäi lµ ma trËn nghÞch ®¶o cña A vµ ký hiÖu lµ B = A-1
TÝnh chÊt:
(AB)-1 = B-1A-1 vµ (A-1)T = (AT)-1 q1 q2
NÕu A = diag(ai) vµ kh«ng suy biÕn th× V V
-1 -1
A = diag((ai) )
Aadj
A 1  víi ma trËn bï Aadj lµ ma trËn
H
det  A H
~  (1) i  j det A 
cã c¸c phÇn tö a ij ji S S
Vµ Aji lµ ma trËn thu ®­îc tõ A b»ng c¸ch bá
®i hµng thø j vµ cét thø i (phÇn tö ë vÞ trÝ ®èi g1 q1 g2
xøng víi a~ )
ij
H×nh 1.3 VÝ dô 1.3.2.1

6
1.2.2 Ma trËn c¸c hµm truyÒn ®¹t
1.2.2.1 VÝ dô
Cho ®èi t­îng cã cÊu tróc MIMO 2 ®Çu vµo u1 vµ u2 cïng 2 ®Çu ra y1, y2 nh­ h×nh 1.2 cña
2 b×nh th«ng nhau.
§¹i l­îng ®iÒu khiÓn ®èi t­îng lµ l­u l­îng q1 vµ q2 ë 2 ®Çu vµo. §¹i l­îng ®­îc ®iÒu
khiÓn lµ mùc n­íc H1, H2. L­u l­îng n­íc ch¶y ra khái b×nh lµ g1, g2 cßn l­u l­îng th«ng
nhau gi÷a 2 b×nh lµ q12. Hai b×nh cã tiÕt diÖn kh«ng ®æi S1 vµ S2.
§èi t­îng ®­îc m« t¶ bëi 2 ph­¬ng tr×nh sau:
S1dH1 
 q1  g1  q12 
dt 
 (1.8)
S1dH1 
q2  g 2  q12 
dt 
L­u l­îng th«ng nhau gi÷a 2 b×nh q12 = q12(H1-H2) nãi
chung lµ 1 hµm phi tuyÕn tÝnh. g1, g2 ®ãng vai trß lµ u1 y1
nhiÔu. V× l­îng ra y1 = H1 vµ y2 = H2 lµ 2 ®¹i l­îng cã
liªn hÖ nhau vµ phô thuéc c¶ 2 tÝn hiÖu ®iÒu khiÓn ®èi u2 y2
t­îng u1 q1 ; u2 q2 nªn ®ã lµ ®èi t­îng cã nhiÒu mèi
liªn hÖ nh­ ë h×nh 1.3 H×nh 1.3
D­íi d¹ng to¸n tö, ®èi t­îng ®­îc m« t¶ bëi hÖ
ph­¬ng tr×nh :
Y1  G11u1  G12u 2  Y1
 u1 G11
 (1.9)
Y2  G21u1  G22u 2 
HoÆc d­íi d¹ng vÐct¬ : G12
Y = G.U trong ®ã :
Y1  u1  G11 G12  G21
Y   ; U   ; G 
Y2  u 2  G 21 G22 U2 Y2
G22
S¬ ®å t­¬ng ®­¬ng nh­ h×nh 1.4
Ngoµi ra c¸c hÖ thuû lùc, nh÷ng ®èi t­îng nhiÒu ®Çu
vµo vµ ra cßn gÆp ë c¸c hÖ ®iÒu hoµ nhiÖt ®é vµ ®é H×nh 1.4
Èm kh«ng khÝ, hÖ ®iÒu chØnh tèc ®é vµ ¸p suÊt tuabin,
c¸c hÖ ®iÒu chØnh nhiÖt ®é vµ møc cña c¸c cét ch­ng cÊt...
1.2.2.2 Ma trËn hµm truyÒn ®¹t
Ma trËn cña c¸c hµm truyÒn ®¹t hay ma trËn hµm truyÒn ®¹t ®­îc x¸c ®Þnh theo ph­¬ng
tr×nh tr¹ng th¸i. BiÕn ®æi Laplace cña vÐct¬ lµ biÕn ®æi Laplace cña c¸c thµnh phÇn:
 Lx1  X 1 ( s )   Lx1 
     
X ( s )  Lxt   ........   ........ ; Lx t   ........ 
     
 Lx   X ( s )  Lx 
 n   n   n 
Mµ Lx t   sX i ( s )  xi (0) , do ®ã:

7
X  AX  Bu (1.10)
Cã: sX(s) x0 = A.X(s) + B.U(s) (1.11)
(sI A)X(s) = B.U(s) + x0 (1.12)
§¸p øng tr¹ng th¸i X(s) víi ®iÒu kiÖn duy nhÊt U(s) = 0 vµ ®¸p øng ra víi ®iÒu kiÖn ®Çu vµ
tÝn hiÖu vµo cã d¹ng:
X(s) = (s.I – A)-1x0; (1.13)
Y(s) = G(s)U(s) + C(sI – A)-1x0 (1.14)
Ma trËn hµm truyÒn sÏ lµ:
G(s) = C(sI – A)-1B (1.15)
Ma trËn liªn hÖ gi÷a ®Çu vµo vµ ®Çu ra theo Laplace víi ®iÒu kiÖn ®Çu b»ng 0.
ë biÓu thøc (1.14) thµnh phÇn thø nhÊt lµ ®¸p øng ®aïa vµo víi x0 = 0 vµ thµnh phÇn thø 2
lµ ®¸p øng ®Çu ra víi ®iÒu kiÖn ®Çu u = 0.
Víi hÖ r ®Çu vµo vµ m ®Çu ra ta cã :
Y1 ( s )  G1 ( s ).........G1r ( s )  u1 ( s ) 
     
........   .......... .......... ........ ; ........ 
      Yi ( s )  Yi1 ( s )  .....  Yir ( s ); Yij ( s )  Gij ( s)U j ( s )
Y ( s ) G ( s ).......G ( s ) u ( s )
 m   m1 mr   r  VÝ dô:
Víi hÖ 2 vµo 2 ra:
r1  u1   y1   K1 0
r   ; u   ; y  ; K   ;
r2  u 2   y 2  0 K 2 

 1 5 
s 1 s5 
G (s)   
 0,4 4 
 
 s  0,5 s  2 
§Ó hÖ æn ®Þnh , mäi nghiÖm tõ hµm truyÒn ®¹t ®Òu lµ nghiÖm tr¸i.
NghÞch ®¶o cña (sI – A) b»ng ma trËn liªn hîp chia cho ®Þnh thøc t­¬ng øng nªn:
adj ( s.I  A) B
G (s)  C D (1.16)
s.I  A

r u y
K G(s)

H×nh 1.5

8
Ch­¬ng II TÝnh æn ®Þnh vµ chÊt l­îng cña hÖ ®a biÕn
2.1 TÝnh æn ®Þnh cña hÖ ®a biÕn
§Þnh lý vÒ æn ®Þnh
HÖ ®­îc m« t¶ bëi ph­¬ng tr×nh tr¹ng th¸i:
d X 
 dt  X  A X  Bu


Y  C X  Du
æn ®Þnh khi vµ chØ khi c¸c gi¸ trÞ riªng cña ma trËn hay nghiÖm cña ph­¬ng tr×nh ®Æc tr­ng
s.I  A  0 ®Òu n»m ë nöa tr¸i cña mÆt ph¼ng s.
0 1 1 
C  1 0; A    ; B 
- 2 - 3  0

s -1 
1 1 s  3 1 
sI  A   ; sI - A   2  
- 2 s  3 s  3s  2 - 2 s

[1 0]  s  3 1  1  s3
W(s)  C ( sI  A) 1 B     
(s  1)(s  2) - 2
 s 0 ( s  1)( s  2)

sI  A  s 2  3s  2
Giá trị riêng là – 1 và – 2 nên hệ ổn định
1 0  0 1 1 0
C  ; A  ; B 
1 1 ­2 ­3  0 ­2 
s ­1  1 1  s  3 1
sI  A    ;  sI­A   2
­2 s  3 s  3s  2 ­2 s 
1 0  s  3 ­2 
1 1  s  3 1 1 0  s  1 ­(s  2) 
W(s)  C ( sI  A) 1 B   
     
(s  1)(s  2) ­2 s  0 ­2  ( s  1)( s  2)
sI  A  s 2  3s  2
Giá trị riêng là – 1 và – 2 nên hệ ổn định
2.2 Tiªu chuÈn chÊt l­îng cña hÖ ®a biÕn
2.2.1 Ph©n tÝch tÝnh æn ®Þnh BIBO
+ Kh¸i niÖm æn ®Þnh BIBO
Mét hÖ thèng ®­îc gäi lµ æn ®Þnh khi kÝch thÝch hÖ b»ng tÝn hiÖu u(t) bÞ chÆn ë ®Çu vµo,
th× hÖ sÏ cã ®¸p øng y(t) ë ®Çu ra còng bÞ chÆn. Kh¸i niÖm æn ®Þnh nµy th­êng ®­îc gäi lµ
æn ®Þnh BIBO (Bound Inputs – Bound Outputs).
+ Tr­íc hÕt tõ mèi quan hÖ gi÷a m« h×nh tr¹ng th¸i

9
d X 
 dt  X  A X  Bu
 (2.1)

Y  C X  Du
Vµ ma trËn hµm truyÒn ®¹t G(s) cña hÖ thèng:
adj ( s.I  A) B
G ( s )  C ( sI  A)1 B  D  C D
s.I  A
Ta thÊy ngay ®­îc r»ng gi¸ trÞ riªng cña ma trËn A trong m« h×nh 1.17 chÝnh lµ ®iÓm cùc
cña hÖ thèng.
2.2.2 §Þnh lý 2.2.2
HÖ (1.17) æn ®Þnh BIBO khi vµ chØ khi ma trËn A cã tÊt c¶ c¸c gi¸ trÞ riªng n»m bªn tr¸i
trôc ¶o tøc lµ khi vµ chØ khi
p ( s )  det s.I  A (2.2)
lµ ®a thøc Hurwitz. Hay nãi c¸ch kh¸c lµ nghiÖm cña ph­¬ng tr×nh ®Æc tr­ng s.I  A  0
®Òu n»m ë nöa tr¸i cña mÆt ph¼ng s.
Nh­ vËy c¸c tiªu chuÈn ®· biÕt nh­ Routh, Hurwitz, Michailov, Lienard_Chipart... ®Òu sö
dông ®­îc ®Ó kiÓm tra tÝnh æn ®Þnh cña hÖ (1.17). VÊn ®Ò h¹n chÕ lµ khi ma trËn A cã sè
chiÒu kh¸ lín. Khi ®ã viÖc x©y dùng ®a thøc ®Æc tÝnh p ( s )  det s.I  A gÆp khã kh¨n.
2.2.3 §Þnh lý Gerchgorin vµ hÖ qu¶
Ph¸t biÓu ®Þnh lý:
Víi mçi gi¸ trÞ riªng sk cña ma trËn phøc (c¸c phÇn tö lµ nh÷ng sè phøc):
 a11 a 12 ... a 1n 
 
  j
 a 21 a 22 ... a 2n 
A 
 ......................  Ri
aii
  σ
 a a ... a 
 n1 n2 nn 

lu«n tån t¹imét chØ sè i = 1,2,...,n sao cho sk n»m trong ®­êng trßn t©m aii b¸n kÝnh Ri, víi
Ri = |ai1| + ... + |aii-1| + |aii+1| + ... + |ain| tøc lµ:
n
s k  aii  Ri   aij (2.3)
j 1
j i
Chøng minh:
 v1 
 
 
V× sk lµ gi¸ trÞ riªng cña A nªn ph¶i tån t¹i mét vector v   ...   0 sao cho:
 
 vn 
(A skI ) v = 0
Trong ®ã 0 lµ ký hiÖu chØ vector cã c¸c phÇn tö ®Òu b»ng 0

10
Suy ra:
n n
 aij v j aii  sk vi  0  aii  sk vi   aij v j
j 1 j 1
j i j i
Víi i = 1,2,...,n, chän 1 chØ sè i sao cho:
| vi | = max{|v1|, |v2|, ..., |vn|}
sÏ cã:
n n n
 s k  aii vi   aij v j   aij . vi  sk  aii   aij (®.p.c.m)
j 1 j 1 j 1
j i j i j i
Theo ®Þnh lý nµy, mçi gi¸ trÞ riªng s icña A ®Òu ®­îc bao bëi 1 ®­êng trßn cã t©m lµ aii vµ
b¸n kÝnh Ri , i = 1, 2, ..., n. Do ®ã nÕu nh­ c¸c ®­êng trßn ®ã ®Òu n»m bªn tr¸i trôc ¶o th×
ch¾c ch¾n tÊt c¶ c¸c gi¸ trÞ riªng si i = 1,...., n ®Òu ph¶i cã phÇn thùc ©m.
HÖ qu¶ ®Þnh lý Gerchgorin
n
Ký hiÖu Ri   aij .
j 1
j i

Khi ®ã hÖ (1.17) víi aij ε R sÏ æn ®Þnh nÕu aii + Ri  0 víi mäi i = 1,..,n
VÝ dô minh ho¹
Cho hÖ m« t¶ bëi:
 3 -1 0  1 
   
dX    
  2 - 3 0  X   0 u
dt
   
 - 2 1 - 4  1 
Tõ ma trËn hÖ thèng cã:
a11 + R1 =– 3 + 1 = – 2 < 0
a22 + R2 =– 3 + 2 = – 1 < 0
a33 + R3 =– 4 +(2 + 1) = – 1 < 0
Do ®ã theo hÖ qu¶ ®Þnh lý Gerchogorin th× hÖ æn ®Þnh
Ta cã thÓ kiÓm tra l¹i nhê ®a thøc ®Æc tÝnh cña hÖ thèng: p(s) = det (sI - A)
§Þnh lý Gerchgorin vµ hÖ qu¶ cña nã sÏ lµ 1 tiªu chuÈn bæ xung , gióp ta xÐt ®­îc tÝnh æn
®Þnh cña hÖ (2.1) mµ kh«ng cÇn ®Õn ®a thøc ®Æc tÝnh (2.2)
2.2.4 Tính bền vững của hệ bất định có cấu trúc: Tiêu chuẩn Kharitonov
Cho 1 lớp mô hình đối tượng tuyến tính có cấu trúc:
1  b1s  ...  bm s m B( s)
G(s)  n
 (2.4)
a0  a1s  ...  an s A( s)
trong đó các tham số bi, i = 0, 1, ..., m và ak, k = 0, 1, ..., n là các tham số bất định
đối tượng bất định được mô tả bởi (2.4) sẽ ổn định khi và chỉ khi G(s) là một hàm bề tức
là khi và chỉ khi
A(s) = a0 + a1s + ansn (2.5)
là đa thức Hurwitz với mọi giá trị tham số ak, k = 0, 1, ..., n.

11
Đa thức A(s) cho trong (1.21) được gọi là đa thức Hurwitz chặt (strictly Hurwitz) nếu nó
là đa thức Hurwitz với mọi giá trị tham số ak thuộc khoảng
ak  ak  ak k = 0, 1, ..., n. (2.6)
2.3 TÝnh bÒn v÷ng cña hÖ ®a biÕn vÒ æn ®Þnh vµ chÊt l­îng
2.3.1 Định lý Kharitonov
Để đa thức A(s) cho trong (2.5) là Hurwitz chặt thì cần và đủ là cả 4 đa thức hệ số hằng
sau đây (được gọi là các đa thức Kharitonov):
K1  a0  a1 s  a2 s 2  a3 s 3  a4 s 4  a5 s 5  a6 s 6  ....

K 2  a0  a1 s  a2 s 2  a3 s 3  a4 s 4  a5 s 5  a6 s 6  ....

K 3  a0  a1 s  a2 s 2  a3 s 3  a4 s 4  a5 s 5  a6 s 6  ....

K 4  a0  a1 s  a2 s 2  a3 s 3  a4 s 4  a5 s 5  a6 s 6  ....


là những đa thức Hurwitz (có nghiệm nằm bên trái trục ảo)
Cách xác định bốn đa thức Kharitonov từ đa thức (2.5) với tính bất định (2.6) tuân theo
quy luật “dịch trái 1 bit”:
– – + + – – + + – ....
– + + – – + + – – ....
+ + – – + + – – + ....
+ – – + + – – + + ....
Chứng minh:
Trước tiên ta nhận thấy:
  
A( j )  a0  a2 2  a4 4  ...  j a1  a3 3  a5 5  ... 
Do vậy từ (2.5) ta sẽ được:
a0  a2 2  a4 4  ...  Re A j   a0  a2 2  a4 4  ....
a1  a3 3  a5 5  ...  Im A j   a1  a3 3  a5 5  ...
Tương tự với:
  
K1 ( j )  a0  a2 2  a4 4  a6 6  ...  j a1  a3 3  a5 5  ... 
K ( j )  a
2

0  a2 2  a4 4  a6 6  ...  j a   a 

1

3
3
 a5 5  ...

K ( j )  a
3

0  a2 2  a4 4  a6 6  ...  j a   a 

1

3
3
 a5 5  ...

K ( j )  a
4

0  a2 2  a4 4  a6 6  ...  j a   a 

1

3
3
 a5 5  ...
Ta đi đến:
ReK1  j   ReK 2  j   Re A j   ReK 3  j   ReK 4  j 

ImK1  j   ImK 4  j   Im A j   ImK 2  j   ImK 3  j 

12
j K2(j) K3(j)

K1(j) K4(j)
+1
Điều này chỉ ra rằng với 1 giá trị  cố định, hàm A(j) có giá trị nằm trong hình chữ
nhật với 4 đỉnh là các giá trị của 4 đa thức Kharitonov.

13
Chương III: Điều khiển LQG đa biến
3.1 Điều khiển đa biến
3.1.1 Phương pháp biến phân
Biến phân là một phương pháp được xây dựng từ điều kiện cần phải có của nghiệm tối ưu
u(t) của bài toán tối ưu động, liên tục có khoảng thời gian T xác định, cho trước và không
bị ràng buộc bởi điều kiện U, hoặc nếu có bị ràng buộc thì tập U của các vector tín hiệu
điều khiển thích hợp phải là một tập hở.
Ý tưởng chính của biến phân có thể tóm tắt như sau:
­ Từ giả thiết u(t) là tín hiệu điều khiển tối ưu, x(t) là quỹ đạo trạng thái tối ưu, người ta
xây dựng một tín hiệu điều khiển khác có 1 sai lệch nhỏ so với nó là:
u~ (t )  u (t )   u (t ) trong đó  u t  rất nhỏ (3.1)
và xem u~ (t ) chưa phải là tín hiệu tối ưu.
­ Tiếp theo, người ta giả thiết quỹ đạo trạng thái ~x (t ) do u~ (t ) tạo ra cho hệ thống cũng
chỉ có 1 sai lệch rấtnhỏ so với quỹ đạo trạng thái tối ưu x(t), tức là:
~
x (t )  x(t )   x (t ) cũng có  x t  rất nhỏ (3.2)
­ Từ điều kiện phải có của tín hiệu điều khiển tối ưu:
Q( x, u )  Q( ~ x , u~) (3.3)
người ta xác định tính chất của điều khiển tối ưu u(t), gọi là tính chất biến phân.
3.1.2 Hàm Hamilton, phương trình Euler – Lagrange và điều kiện cần
Xét bài toán tối ưu động, liên tục có diểm đầu xo và thời gian cố định T cho trước:
d x
 dt  f  x, u , x 0  x (0) (3.4)

 T

Q( x, u )   g ( x, u )dt  min (3.5)
 0
Giả sử u(t) là nghiệm tối ưu của bài toán liên tục và x(t) là quỹ đạo trạng thái tối ưu tương
ứng. u~ (t ) là vector tín hiệu điều khiển được biến phân từ u(t) theo công thức (3.1) và
~
x (t ) là quỹ đạo trạng thái tương ứng của nó thoả mãn điều kiện biến phân (3.2). Khi đó
ta có (3.3).
x(t) x(t) S(T)
x(T)=0
x(T)0
x(t) ~
x (t )
~ o
x (t ) x0
x0

Điểm đầu và điểm cuối cố định Điểm đầu cố định điểm cuối ràng buộc

Minh hoạ công thức biến phân


Từ hình minh hoạ ta có qua hệ giữa lượng biến phân trạng thái x(t) và thời điểm trạng
thái cuối x(T) như sau:
­ nếu x(T) là cố định và cho trước thì phải có x(T) = 0.

14
­ nếu x(T) là không cố định (vd bị ràng buộc) thì có thể có x(T)  0.
Sau cùng 1 khoảng thời gian T không đổi ta sẽ có:
T
Q( ~
x , u~)   g x   x .u   u dt  Qu, x    Q  0   
Q

0
Bởi vậy từ bất đẳng thức (3.3) và bằng tích phân chuỗi Taylor ta sẽ xấp xỉ được thành:
T  g g 
0   Q  Q( ~
x , u~)  Qu, x      x   u dt (3.6)
0 x u 

Trong đó:
g  g g g  g  g g g 
 , ,..., ;   , ,...,  là các ký hiệu ma trận Jacobi của
 x  x1 x2 xn  u  u1 u 2 un 
hàm nhiều biến g(x, u)
Hoàn toàn tương tự, từ mô hình trạng thái (3.4) của hệ ta cũng có:
dx
 f  x, u  và

d x  
x  f x   , u  u 
dt dt x u
d df df
dt
 x u

 x  f x   , u  u  f  x, u  
dx
 x  
du u

d df df  d x d f df 
 x  x T
u 0 p   x  u 0 (3.7)
dt dx du  dt dx du 
 
trong đó pT là một véctor n chiều tuỳ ý.
 f1  f1   f1  f1 
 ....   .... 
  x1  x n   u1 u m 
   
df   df 
 .................... ;  ....................  là các ma trận Jacobi của vector hàm
dx   du  
   

 n f  f  f  f
n  n n
  x ....  x   u .... u 
 1 n  1 n
f(x,u).
Kết hợp chung (3.6) và (3.7) lại ta có :
T  g g T  d x d f df 
0 Q     x  u  p   x   u dt
 x  u  dt d x d u 
0   
áp dụng tích phân toàn phần ta được:

15
T  g f   d pT d f d g  
T 
0   Q  p (T ) x (T )    p T  u   p T   x dt
 
0  u u 

dt dx dx
 

(3.8)
vì  x = 0 do điểm đầu x0 là điểm xác định cho trước (hình) nhưng do vector p(T) là vector
bất kỳ nên có thể chọn:
d pT df dg
  pT
T
 với điều kiện biên: p (T ) x (T ) = 0
dt dx dx
Khi đó p(T) được gọi là vector đồng trạng thái (co­state) đồng thời bất đẳng thức (3.8) trử
thành:
T  g f  
0   Q     pT  u dt (3.9)
0   u  u  
Cuối cùng sử dụng ký hiệu hàm Hamilton:
H(x, u, p) = pTf(x, u) – g(x, u) (3.10)
Ta sẽ được phương trình Euler­ Lagrange như sau:
T T
d x  H  dp  H  T
 ;    với p (T ) x (T ) (3.11)
dt   p  dt  x 
 
Và công thức biến phân bậc nhất hàm mục tiêu trở thành:
T H
0 Q     u dt (3.12)
0  u
Định lý: (điều kiện cần)
Nếu u(t) là nghiệm của bài toán tối ưu động liên tục (3.4), (3.5) có điểm đầu x0 và khoảng
thời gian T cho trước thì nghiệm đó phải thoả mãn:
H x, u, p  T
0 (3.13)
u
trong đó H(x,u,p) là hàm Hamilton xác định theo công thức (3.10) và vector p(t) là
nghiệm của phương trình Euler­ Lagrange (3.11) ứng với u(t), x(t) tối ưu
Phương pháp tìm nghiệm tối ưu của bài toán (3.4), (3.5) có điểm đầu x0 = x(0) và khoảng
thời gian T cố định, cho trước, bằng cách thực hiện lần lượt các bước sau:
­ Lập hàm Hamilton (3.10)
­ Giải phương trình vi phân (3.13) để có quan hệ u(x,p)
­ Thay quan hệ vừa tìm được vào (3.11) để được hệ phương trình vi phân cho các
(vector) biến x và p
­ Giải hệ phương trình có từ bước trên với các điều kiện biên x(0) = x0 và x(T) = xT
T
hoặc p (T ) x (T ) = 0 để có nghiệm x(t) và p(t)trong đó:

16
a. Nếu điểm cuối x(T) = xT là tự do (hoặc bị ràng buộc), tức là khi có  x (T )  0 thì
phải có p(T)= 0. Đây chính là bài toán tối ưu có điểm trạng thái đầu cố định, điểm
trạng thái cuối tự do hoặc bị ràng buộc.
b. Nếu cho trước điểm cuối x(T) = xT thì p(T) là tuỳ ý, vì đã có  x (T )  0 . đây chính
là bài toán tối ưu có điểm trạng thái đầu, cuối cố định và T cho trước.
­ Thay nghiệm x(T), p(t) tìm được ở bước 4 vào quan hệ u(x,p) đã có từ bước 2 hoặc
trực tiếp vào mô hình (3.4) cảu hệthống để có nghiệm u(t) tối ưu.
Ví dụ
Cho hệ có mô hình:
dx 1 1
  x  u hãy tìm u*(t) đưa hệ đi từ điểm đầu x(0) = 4 đến điểm cuối x(4) = 0 và
dt 2 2
4
làm cho: Q( x, u )    x 2  u 2 dt  min
0 
nhận xét:
Đây là bài toán tối ưu động, liên tục, không ràng buộc. có điểm đầu, điểm cuối cố định và
khoảng thời gian T = 4 cho trước.
Áp dụng phương pháp biến phân, ta có:
 1 1 
­ x  u   x2  u2
Lập hàm Hamilton H ( x, u , p )  p 
 2 2 
H 1
­ Xác định quan hệ u(x,p) từ  0 được u  p
u 4
­ Thay quan hệ tìm được vào phương trình Euler­Lagrange (3.11) ta được hệ phương
trình:
 1 1
  
d  x   2 8  x 

dt  p    
   2 1  p 
 
2
A
Giải hệ phương trình vi phân trên được:
 x  k1e s1  k 2 e s2


 p  k3e s1  k 4 e s2
trong đó s1, s2 là những giá trị riêng của ma trận A, tức là nghiệm của: det(sI – A) = 0
1 1
 s1  ; s2  
2 2
các hệ số k1, k2 được xác định từ điều kiện biên x(0) = 4 và x(4) = 0 như sau:

17
k1  k 2  4 k1  0,014 t

t
 2 2
   x(t )  0,014e  4,014e
k1e 2 2  k 2 e 2 2
 0 k 2  4,014
Thay x(t) tìm được vào mô hình của hệ đã cho được u(t) tối ưu:
t t
 
2 2
u (t )  0,034e  1,663e
3.1.3 Phương trình vi phân Riccati. và bộ điều khiển tối ưu tĩnh phản hồi trạng thái
cho đối tượng tuyến tính (trường hợp thời gian vô hạn)
Phương trình vi phân Riccati có dạng:
dK
 C  AT K  KA  KBD 1 B T K (3.14)
dt
Phương trình này là phương trình phi tuyến có nhiều nghiệm, nên để xác định được
nghiệm nào thoả mãn bài toán tối ưu ta phải xét các tính chất cơ bản phải có của ma
trận K:
Định lý:
Ma trận K(t) của bài toán tối ưu có các tính chất sau:
a. K(T) =  trong đó  là ký hiệu của ma trận chỉ có các phần tử bằng 0.
b. K(t) phụ thuộc T và khi T → thì K(t) →K là một ma trận hằng (hình 3.2)
KT
T t
0
T
K tăng
Hình 3.2 minh hoạ định lý

c. K(t) không phụ thuộc x0


d. K(t) là ma trận đối xứng
1 T
e.  x0 K (0) x 0  Qmin (giá trị nhỏ nhất của hàm mục tiêu)
2
f. K(0) là ma trận xác định bán âm
3.2 Phương trình vi phân Riccati. và bộ điều khiển tối ưu tĩnh phản hồi trạng thái cho đối
tượng tuyến tính (trường hợp thời gian vô hạn)
3.2.1 Phát biểu bài toán
Xét bài toán điều khiển tối ưu cho đối tượng tuyên tính tham số hằng :
d x
 dt  A( x)  B (u ) (3.15a)


 1 T T
Q( x, u )  2  ( x C x  u Du )dt  min (3.15b)
 0
trong đó C là ma trận xác định bán dương, D xác định dương và 2 ma trận là đối xứng
Yêu cầu của bà toán :

18
Xác định vector tín hiệu điều khiển u(t) tối ưu, tuỳ ý, nhưng cho trước, tới 1 điểm trạng
thái x bất kỳ nào đó của không gian trạng thái Rn trong khoảng thời gian vô cùng lớn
(T =  ), sao cho trong quá trình chuyển đổi trạng thái đó chi phí tính theo phiếm hàm
mục tiêu 3.15b đạt giá trịn nhỏ nhất Qmin
3.2.2 Lời giải bài toán 3.15 ­ Bộ điều khiển tối ưu phản hồi dương
­ nghiệm tối ưu u(t) của bài toán (3.15) có dạng :
u = D-1BTK x (3.16)
trong đó K   lim K (t ) là ma trận hằng, đối xứng và xác định bán âm.
T 
dK 
­ Từ phương trình vi phân Riccati (3.14) với   ta suy ra ma trận hằng K phải là
dt
nghiệm xác định bán âm của phương trình đại số Riccati :
K  BD 1 B T K   AT K  KA  C (3.17)
­ Với tín hiệu điều khiển tối ưu u(t) xác định theo (3.16), (3.17) hàm mục tiêu sẽ đạt giá
trị nhỏ nhất Qmin và giá trị đó được tính bằng :
1 T
Qmin   x 0 K  x 0
2
Tín hiệu tối ưu (3.16) có thể được tạo ra bởi bộ điều khiển tĩnh R, phản hồi dương trạng
thái gọi là bộ điều khiển LQR (Linear Quadratic Regulatior) :
R = D-1BTK (3.18)
khi đó hệ kín bao gồm đối tượng (3.15a) và bộ điều khiển (3.18) sẽ có mô hình :
dx
 ( A  BR) x  Bu (3.19)
dt
­ Tuy điểm cuối x là bất kỳ nhưng để hàm mục tiêu Q(x,u) có giá trị hữu hạn Qmin thì
T
 T

hàm dưới dấu tích phân của nó phải thoả mãn : lim x C x  u Du  0 tức là 2 giá trị
t 
T T
x   lim x và u   lim u phải thoả mãn :
t  t 
T T
x  C x   0; u  Du   0
Nhưng vì C xác định bán dương, D xác định dương, nên cuối cùng phải có :
a. u = 0
T
b. x phải là điểm cân bằng của hệ kín (3.19) và thoả mãn x  C x   0 . như vậy
chắc chắn sẽ có x = 0 nếu (A + BR) không suy biến hoặc C xác định dương.
c. Khi C xác định dương hoặc ma trận (A+BR) không suy biến thì do chắc chắn có
x = 0 với mọi x0 nên bộ điều khiển tối ưu R sẽ làm ổn định hệ kín. Nói cách khác,
khi bị nhiễu tức thời đánh bật ra khỏi điểm cân bằng gốc toạ độ 0 thì bộ điều khiển R
sẽ đưa hệ quay trở lại 0 và hơn thế, chi phí cho quá trình quay về đó tính theo (3.15b)
là nhỏ nhất.

19
=0 u dx x
 A x  Bu
dt

R  D 1 B T K 
Bộ điều khiển tối ưu tĩnh, phản hồi trạng
thái dương

Ví dụ :
Cho đối tượng có mô hình trạng thái
d x  0 0  1 
 x u
dt 1 0   0 
   
và hàm mục tiêu :
1   T  5 0  
Qmin   x x  u 2  dt  min
2 0  0 4 
   
Như vậy : ta có A, B, C, D. Do đối tượng có 2 biến trạng thái (n = 2) nên nghiệm K
của phương trình đại số Riccati phải là ma trận (2x2). Ngoài ra, vì K là ma trận đối
 k1 k3 
xứng giốngnhư C, D nên nó có dạng K     . Thay các giá trị A, B, C, D
 
 k3 k 2 
vào (3.17) ta được :
k12  2k3  5  0
 k12 k 1k3   k3 k 2   k3 0  5 0 
  
     k 2  4  0
         3
2  0 0
 k1k3 k 3   0 0   k 2 4 
k1k3  k 2  0

Hệ phương trình trên có các nghiệm sau :
a. k3 = 2 ; k1 = 1 ; k2 = –2
b. k3 = 2 ; k1 = – 1 ; k2 = 2
c. k3 = – 2 ; k1 = 3 ; k2 = 6
d. k3 = – 2 ; k1 = – 3 ; k2 = – 6
chỉ có nghiệm d. mới làm cho K xác định bán âm tức là ma trận có giá trị riêng với
phần thựckhông dương. Bởi vậy :
  2  3
K    và bộ điều khiển tối ưu, phản hồi dương sẽ là :
 
 3  6

20
  2  3
R  D 1 B T K   1 0    (3 2)
 
 3  6
3.2.3 Bộ điều khiển tối ưu phản hồi âm
Phương pháp xác định bộ điều khiển tối ưu tĩnh, phản hồi dương trạng thái với ma trận
K là nghiệm xác định bán âm của phương trình đại số Riccati (3.17) cũng được áp dụng
khi bộ điều khiển là phản hồi âm, bằng cách trong phương trình đại số (3.17) ta thay K
bởi K = L. khi đó ta sẽ đi đến các bước thiết kế sau :
1. Tìm nghiệm L xác định bán dương của phương trình đại số Riccati :
L BD 1 B T L  AT L  LA  C (3.20)
2. Xác định bộ điều khiển phản hồi âm, cũng được gọi là bộ điều khiển LQR (Linear
Quadratic Regulator) :
R = D­1BTL (3.21)
Chú ý : Giống như ở bài toán phản hồi dương hoặc ma trận (A – BR) của hệ kín (hình
dưới) không suy biến thì chắc chắn điểm trạng thái cuối sẽ là x = 0 với mọi x0 và do đó
bộ điều khiển tối ưu (3.21) sẽ làm hệ ổn định
=0 u dx x
 A x  Bu
_ dt

R  D 1 B T L
Bộ điều khiển tối ưu tĩnh, phản hồi (âm)
trạng thái

Ví dụ :
Cho bài toán tối ưu :
d x  0 3  1 
 x u
dt 1 0   0 
   
và hàm mục tiêu :
1
Qmin  
  16 x22  u 2 dt  min
20

21
 l1 l3 
Như vậy : ta có A, B, C, D. Thay các giá trị trên và ma trận L    vào (3.21)
 
 l3 l 2 
ta
 l1 l3 1   l1 l3   l1 l3  0 3   0 3  l1 l3   0 0 
           
  1 0            
 l3 l2  0   l3 l 2   l3 l2 1 0  1 0  l3 l2   0 16 

được : l12  2l3  0




 l1 l3  3  l2  0

l 2  6l  16
3 3
Hệ phương trình trên có 4 nghiệm song chỉ có nghiệm l3 = 8 ; l1 = 4 ; l2 = 20 là thoả
mãn xác định bán dương, (có các giá trị riêng với phần thực không âm)
4 8 
L    và bộ điều khiển tối ưu, phản hồi âm sẽ là :
 
 8 20 
4 8 
R  D B K   1 0 
1 T   (4 8)
 
 8 20 
3.3 Bộ quan sát trạng thái Kalman (Lọc Kalman)
3.3.1 Mục đích của bộ quan sát trạng thái
Trong các phương pháp điều khiển phản hồi trạng thái người ta thường giả thiết vector tín
hiệu trạng thái x là đo được (nhờ các bộ cảm biến) để phản hồi ngược về cho bộ điều
khiển. Điều này trong thực tế thường không thực hiện được, đơn giản chỉ vì có khá nhiều
biến trạng thái không thể đo được trực tiếp mà chỉ có thể xác định được một cách gián
tiếp thông qua những tín hiệu đo được khác. Ví dụ như động cơ xoay chiều 3 pha thì biến
trạng thái dòng từ thông của động cơ là không đo được trực tiếp, nó chỉ có thể xác định
được thông qua những đại lượng tín hiệu đo được trực tiếp khác là giá trị dòng điện Stator
và giá trị tốc độ vòng quay động cơ. Ví dụ ở hệ cơ thì động năng của 1 vật đang chuyển
động cũng chỉ có thể xác định được thông qua vận tốc và khối lượng của vật đó…
Trong hệ thống điều khiển, các vector tín hiệu vào u(t), ra y(t) bao giờ cũng là những tín
hiệu đo được trực tiếp. Giả sử nhờ các bộ cảm biến (sensors) ta đã đo được giá trị u(t),
y(t) trong khoảng thời gian hữu hạn t0  t < T. Khi đó một cơ cấu có nhiệm vụ xác định
giá trị trạng thái x(t0) của hệ thống tại thời điểm to từ những giá trị đã đo được trong
khoảng thời gian hữu hạn t0  t < T sẽ được gọi là bộ quan sát trạng thái (state Observer).
Nói cách khác,bộ quan sát trạng thái là một cơ cấu có nhiệm vụ thực hiện phép biến đổi:
x(t0)= q(u(t),y(t)) với t0  t < T trong đó T là hữu hạn (3.22)
Tất nhiên không phải ở mọi hệ thống ta đều có thể quan sát được tín hiệu trạng thái mà
chỉ với những hệ quan sát được, tức là hệ mà ở đó tồn tại toán tử q(., .) và 1 hằng số thời

22
gian hữu hạn T thoả mãn (3.22). Nếu hằng ssô T còn được chọn tuỳ ý miễn rằng T > t0 thì
hệ được gọi là quan sát được hoàn toàn.
n x (t )
n y (t )
d x
u  dt  f ( x, u )  n x (t ) y
y 

 y  g ( x)  n y (t )

~
x Bộ quan sát
trạng thái

Hình 3.4. Nhiệm vụ của bài toán thiết kế bộ


quan sát trạng thái
Xét hệ thống có mô hình trạng thái
d x
 dt  f ( x, u )  n x (t )


 y  g ( x)  n y (t )
trong đó nx(t) là véctor các tín hiệu nhiễu tác động vào hệ thống và ny(t )là vector các tín
hiệu nhiễu tác động ở đầu ra. Nhiệm vụ đặt ra ở đây là phải xây dựng được bộ quan sát
trạng thái để với nó có được ~ x (t 0 ) thoả mãn ~
x (t 0 )  x(t 0 ) trên cơ sở đo các tín hiệu vào
ra u(t), y(t) trong khoảng thời igan hỡu hạn t0  t < T (hình 3.4). Vì cấu trúc bộ quan sát
trạng thái không được phụ thuộc vào nhiễu thì cũng nx(t), ny(t ) nên mô hình trạng thái của
nó phải có dạng:
d~
x ~ ~
 f ( x , u, y)
dt
~ ~
Mặt khác, nếu có ~
x  x thì cũng phải có f ( ~
x , u , y )  f ( x, u )
d~ x ~ ~
Suy ra:  f ( x , u)  l (~
x , y ) với lim
~
(~
x , y)  0 (3.23)
dt x x
Bài toán đặt ra ở đây là phải xác định l ( ~ x , y ) thoả mãn:
lim ( ~
~
x , y )  0 và ~ x (t )  x(t ) (3.24)
x x
3.3.2 Thiết kế bộ quan sát trạng thái cho đối tượng tuyến tính
Cho đối tượng tuyến tính, bị tác động bởi nhiễu hệ thống nx(t) và nhiễu đầu ra ny(t ), mô tả
bởi phương trình trạng thái:

23
d x
 dt  A( x )  B (u )  n x
 (3.25)

y  Cx  ny
Trong đó A, B, C là các ma trận hằng, x là vector biến trạng thái, u là vector tín hiệu vào
(tín hiệu điều khiển), y là vector các tín hiệu ra, nx là vector các tín hiệu nhiễu tác động
vào hệ thống và ny là vector các tín hiệu nhiễu tác động ở đầu ra.
Giả thiết nx(t), ny(t )là những vector tín hiệu nhiễu ồn trắng có kỳ vọng bằng 0
khi đó: theo (3.23) bộ quan sát trạng thái cho đối tượng tuyến tính sẽ là:
d~
x u 
 A x  Bu  L( y  C x )  ( A  LC ) x  ( B L) 
~ ~ ~ (3.26)
dt  
 y
và nhiệm vụ thiết kế còn lại là xác định ma trận L sao cho có được ~
x (t )  x(t )
~
Lập hàm mô tả sai lệch e(t )  x(t )  x (t ) ta sẽ được:
de d ( x  ~
x)
  A( x  ~
x )  n x  L( y  C ~
x )  ( Ae  n x  L(C x  n y  C ~
x)
dt dt

 nx 
 ( A  LC )e  n x  L n y  ( A  LC )e  ( I - L) 
     
A B ny 
n

~ ~
 Ae  B n
I: là ma trận đơn vị.
Để có được ~ x (t )  x (t ) tức là e(t)  0 ta phải tìm L sao cho :
n
 
T
Q  M e e   M ei2  min
i 1
 
sau khi biến đổi ta được :
L = PCTNy-1 (3.27)
Với P là nghiệm xác định bán dương của phương trình Riccati :
PCTNy-1CP –PAT – AP =Nx (3.28)
Ta thấy rõ ràng việc xác định ma trận L cho bộ quan sát trạng thái (3.26) bằng 2 công
thức (3.27), (3.28) chính là bài toán thiết kế bộ điều khiển tối ưu R = LT phản hồi âm
trạng thái cho đối tượng đối ngẫu của (3.25)
d x T T
 dt  A x  C u

 (3.29)
1 T

 T

QK  2  x N x x  u N y u dt  min
 0

24
Từ đây ta đến được 2 bước xác định bộ quan sát trạng thái tối ưu của Kalman như sau:
1. Giải bài toán tối ưu (3.29) để có được ma trận R=LT là bộ điều khiẻn tối ưu phản
hồi âm trạng thái cho đối tượng (3.29a) theo tiêu chuẩn tối ưu (3.29b). Các ma trận Nx, Ny
được xác định từ nhiễu nx(t), ny(t )trong đó Nx là ma trận xác định bán dương Ny là ma trận
xác định dương.
2. Gán L tìm được vào công thức (3.26) để có hoàn chỉnh mô hình bộ quan sát
trạng thái cho đối tượng (3.25)
Ví dụ:
Thiết kế bộ quan sát trạng thái Kalman:
Cho đối tượng mô tả bởi:
 d x  0 1   1
   x   u  n
x
 dt  2 0  1

  
 A B

 y  (0 1) x  n y
 
 C
Hãy thiết kế bộ quan sát trạng thái cho đối tượng biết rằng nx, ny là các tín hiệu nhiễu ồn
trắng với:
 4 3
Nx    và N = 1
y
 
3 6
Trước hết ta giải bài toán tối ưu
d x 0 2 0
  AT x  C T u    x   u
 dt    
 1 0  1 


  8 6  
QK  1   x T   x  u 2 dt  min
 2 0  6 9 
    

Áp dụg thuật toán thiết kế bộ điều khiển phản hồi âm trạng thái R = LT đã trình bày ta
được:
T
 0  l1 l3 
R 11  
L trong đó L    là nghiệm xác định bán dương của phương trình
    
1   l3 l 2 
Riccati

25
 l1 l3  0   l l   l l  0 2   0 1  l1 l3   8 6 
  (0 1) 1 3    1 3     
            
 l3 l2 1   l3 l2   l3 l2 1 0   2 0  l3 l2   6 9 

 l32 - 2l3 l2 l3  2l1  l2   8 6 


   
  
l l - l - l  
23 1 2 l22  4l3   6 9 

l32 - 2l3  8


 l 2l3  2l1  l2  6

l 2  4l  9
2 3

Giả hệ phương trình trên và chỉ lấy nghiệm xác định bán dương ta được:
 l1 l 3   4 ,5 4
L    
   
 l3 l2   4 5
 4,5 4   4
suy ra R  LT  0 1   ( 4 5)  L   
   
4 5 5
Vậy bộ quan sát trạng thái tối ưu của đối tượng đã cho là:
d~
x u  0 - 3 1 4  u 
 ( A  LC ) ~
x  (B L)    ~x   
dt       
 y  2 5  1 5  y 

3.4 Điều khiển LQG (Linear Quadratic Gaussian)


Bài toán thiết kế bộ điều khiển LQG còn được gọi là điều khiển đối tượng bền vững với
nhiễu, được phát biểu như sau :
Cho đối tượng tuyến tính tham số hằng bị tác động bởi nhiễu ồn trắng nx(t) vào hệ thống
và ny(t) ở đầu ra, mô tả bởi mô hình trạng thái :
d x
 dt  A x  Bu  n x


y  Cx  ny
Hãy thiết kế bộ điều khiển phản hồi tín hiệu ra sao cho hệ được ổn định tối ưu theo nghĩa
khi bị một tác động không mong muốn đánh bật ra khỏi điểm cân bằng (điểm làm việc),
bộ điều khiển đó sẽ đưa được hệ quay trở về điểm cân bằng cũ (điểm làm việc cũ) và chi
1 T
 T

phí cho quá trình quay về đó tính theo Q   x E x  u F u dt đạt giá trị nhỏ nhất.
20
26
n x (t ) n y (t )
 u y
Đối tượng tuyến tính
_ y

Bộ điều ~
x Bộ quan sát
khiển LQG Kalman

Hình 3.5. Nguyên tắc thiết kế bộ điều khiển LQG


Mới nhìn, nó giống như bài toán thiết kế bộ điều khiển tối ưu động LQR, tuy nhiên nó có
2 điểm khác biệt cơ bản đó là :
­ Bộ điều khiển là phản hồi tín hiệu ra chứ không phải phản hồi trạng thái
­ Đối tượng có nhiễu tác động ở cả đầu vào và đầu ra
Mặc dù có sự khác biệt song nhờ tính thoả mãn nguyên lý tách được của hệ tuyến tính mà
bài toán thiết kế bộ điều khiển phản hồi tín hiệu ra LQG sẽ được chuyển về bài toán thiết
kế bộ điều khiển phản hồi trạng thái LQR. Nói cách khác, bộ điều khiển LQG sẽ được
thiết kế gồm 1 bộ điều khiển tối ưu phản hồi trạng thái LQR và một bộ quan sát trạng thái
Kalman mắc nối tiếp nhau như mô tả hình 3.5.
Thuật toán thiết kế bộ điều khiển LQG với các bước sau :
1. thiết kế bộ điều khiển tối ưu RLQG phản hồi âm trạng thái x(t), tức bộ điều khiển
LQR cho bài toán
d x
 dt  A x  Bu


1 T

Q  
20
 T

x E x  u F u dt  min

Tức là phải tính RLQR=F-1BTL
trong đó L là nghiệm xác định bán dương của phương trình đại số Riccati :
LBF-1BTL - ATL - LA = E
điều kiện để bài toán này có nghiệm là E xác định bán dương, F xác định dương
2. thiết kế bộ quan sát trạng thái Kalman để có được trạng thái xấp xỉ gần đúng ~
x (t )
từ các tín hiệu đo được u(t), y(t) làm tín hiệu đầu vào cho bộ điều khiển RLQR. Ở đây ta lại
đitìm bộ điều khiển tối ưu phản hồi âm trạng thái LT(bộ điều khiển LQR) cho bài toán
d x T T
 dt  A x  C u


1 T

 T

Q  2  x N x x  u N y u dt  min
 0

27
Trong đó Nx, Ny là các ma trận hàm tương quan của nhiễu ồn trắng nx(t), ny(t). Cuối cùng
thay L vào công thức (3.23) để được mô hình động của bộ quan sát :
d~
x u 
~
 ( A  LC ) x  (B L) 
dt  
 y
Ví dụ:
Cho đối tượng mô tả bởi:
 d x  1 2  1 
   x   u  n
x
 dt  3 4   2 
  
 A B

 y  (1 1) x  n y
 
 C
Hãy thiết kế bộ điều khiển LQG với
 
 1 0 

1  T   1 2
Q  x
20 


T

20
 
x  u F u  dt   x1  x 22  u 2 dt  min (F = 1)
 0 1 

 E 
Trước hết giải bài toán tối ưu tìm RLQR là nghiệm của:
 d x 1 2  1 
    x   u
 dt    
3 4 2

 
 Q  1  x12  x 22  u 2 dt  min
 
 20
Áp dụng các bước thuật toán tìm bộ điều khiển tối ưu phản hồi âm trạng thái đã trình bày
ta có được RLQR = (2,73 4,24)
Tiếp theo ta lại tìm LT là bộ điều khiển tối ưu của bài toán
d x 1 2  1 
 T
 A xC u  T   x   u
 dt    
3 4 2

 
Q  1  x T N x x  u T N y u dt  min
 
 20
Với Nx, Ny được chọn là các ma trận phù hợp (Nx = I, Ny = 1)
Lại áp dụng thuật toán như trên ta có :

28
 3,27 
LT = (3,27 7,72)  L   
 
 7,72 
Vậy bộ điều khiển LQG sẽ bao gồm bộ quan sát trạng thái Kalman :
d~
x  u    2,27 - 1,27  1 3,27  u 
 ( A  LC ) ~
x  (B L)    ~x    mắc nối tiếp với bộ
dt       
 y   - 4,72 - 3,72   2 7,72  y 
điều khiển tĩnh RLQR = (2,73 4,24)

29

You might also like