Professional Documents
Culture Documents
Chuong 3 LTDKNC
Chuong 3 LTDKNC
© H. T. Hoàng - HCMUT 1
Chương 3
© H. T. Hoàng - HCMUT 2
Nội dung chương 3
Giới thiệu
Tối ưu hóa tĩnh
Tối ưu hóa động và phương pháp biến phân
Điều khiển tối ưu liên tục dùng phương pháp biến
phân
Phương pháp qui hoạch động Bellman
Điều khiển tối ưu toàn phương tuyến tính LQR
Ước lượng trạng thái tối ưu (lọc Kalman)
Điều khiển tối ưu LQG
© H. T. Hoàng - HCMUT 3
GIỚI THIỆU
© H. T. Hoàng - HCMUT 4
Giới thiệu
Điều khiển tối ưu : xác định luật ĐK cho hệ thống động
cho trước sao cho tối thiểu hóa một chỉ tiêu chất lượng.
ĐK tối ưu được phát triển trên cơ sở toán học: phương
pháp biến phân (Bernoulli, Euler, Lagrange, Weiertrass,…)
Từ những năm 1950, ĐK tối ưu phát triển mạnh mẽ và trở
thành một lĩnh vực độc lập.
Phương pháp quy hoạch động do Richard Bellman đưa
ra trong thập niên1950.
Nguyên lý cực tiểu Pontryagin do Lev Pontryagin và
các đồng sự đưa ra trong thập niên 1950.
Bài toán điều chỉnh toàn phương tuyến tính và lọc
Kalman do Rudolf Kalman đưa ra trong những
năm1960.
© H. T. Hoàng - HCMUT 5
Phân loại bài toán điều khiển tối ưu
ĐK tối ưu tĩnh: chỉ tiêu chất lượng không phụ thuộc thời
gian
ĐK tối ưu động: chỉ tiêu chất lượng phụ thuộc thời gian
Bài toán chỉnh toàn phương tuyến tính (Linear
Quadractic Regulator – LQR)
Bài toán điều khiển tối ưu H2
…
© H. T. Hoàng - HCMUT 6
Ứng dụng
Trước khi máy tính số ra đời, chỉ có thể giải được
một số ít bài toán điều khiển tối ưu đơn giản
Máy tính số ra đời cho phép ứng dụng lý thuyết điều
khiển tối ưu vào nhiều bài toán phức tạp.
Ngày nay, điều khiển tối ưu được ứng dụng trong
nhiều lĩnh vực:
Không gian (aerospace)
Điều khiển quá trình (proccess control)
Robot
Kỹ thuật sinh học (bioengineering)
Kinh tế
Tài chính
…
© H. T. Hoàng - HCMUT 7
TỐI ƯU HÓA TĨNH
© H. T. Hoàng - HCMUT 8
Tối ưu hóa tĩnh không ràng buộc
Bài toán tối ưu tĩnh không ràng buộc: tìm m thông
số thực (hay phức) u1, u2,…, um sao cho hàm
L(u1, u2,…, um) đạt cực tiểu:
L(u)=L(u1, u2,…, um) min
trong đó u=[u1, u2,…, um]T
© H. T. Hoàng - HCMUT 9
Điều kiện cực trị không ràng buộc
Giả sử L(u) khả đạo hàm theo u, thì điều kiện cần và
đủ để u* là điểm cực tiểu cục bộ là:
Lu (u* ) 0
uu ) 0
*
L ( u
trong đó:
L u1
L u
L 2
Lu
u
L um
2
L u u
1 1 2
L u u
1 2 2
L u1u m
L
2
Luu 2
u
2 L umu1 2 L umu2 2 L umum
© H. T. Hoàng - HCMUT 10
Tìm cực trị không ràng buộc – Thí dụ 1
Tìm cực trị hàm: L(u) 5u12 2u22 2u1u2 8u1 3u2
Giải:
Điều kiện cần có cực trị:
L
L u1 10u1 2u2 8 0 u1* 0.7222
Lu 0 *
u L 2u1 4u 2 3 0 u 2 0.3889
u2
Xét vi phân bậc hai:
2L 2L
10 2
u 2
u1 u 2 Luu 0
Luu 2 1 Luu
L 2L 2 4
u u u 22
1 2
1 2 ) (0.7222;0.3889)
* *
(u , u là điểm cực tiểu.
© H. T. Hoàng - HCMUT 11
Tìm cực trị không ràng buộc – Thí dụ 1
u* (0.7222;0.3889)
250
200
150
L 100
50
-50 u* 4
6 2
4 2 0
0
u2
-2 -4 -6 -4
-2
u1
© H. T. Hoàng - HCMUT 12
Tối ưu hóa tĩnh có ràng buộc
Bài toán tối ưu tĩnh có ràng buộc: tìm vector thông số
u sao cho hàm L(x,u) đạt cực tiểu, đồng thời thỏa
điều kiện f(x,u)=0
L(x,u) min
f(x,u)=0
trong đó x=[x1, x2,…, xn]T
u=[u1, u2,…, um]T
L : n m : hàm đánh giá
f : n m p : điều kiện ràng buộc
© H. T. Hoàng - HCMUT 13
Hàm Hamilton
Định nghĩa hàm Hamilton:
H ( x , u) L ( x , u) T f ( x , u)
trong đó là vector hằng số, gọi là thừa số Larrange
p
x
x
© H. T. Hoàng - HCMUT 15
Độ dốc của hàm mục tiêu với điều kiện ràng buộc
L( x , u) L( x , u)
Vi phân hàm mục tiêu: dL( x , u) dx du
x u
f ( x, u) f ( x , u)
Do f(x,u) = 0 nên: df ( x, u) dx du 0
x u
1
f ( x , u ) f ( x , u)
dx du
x u
Thay (2) vào (1), ta được:
1
L( x , u) f ( x , u) f ( x , u) L( x , u)
dL( x , u) du du
x x u u
f ( x, u) L( x , u) H ( x , u)
dL( x, u) T du dL( x , u) du
u u u
Với ĐK f(x,u)=0, độ dốc của L(x,u) theo u chính bằng Hu(x,u)
Điều kiện để L(x,u) đạt cực trị với ràng buộc f(x,u)=0 là:
H u ( x , u) 0
© H. T. Hoàng - HCMUT 16
Điều kiện cần cực trị có ràng buộc
Kết hợp với điều kiện xác định hằng số Lagrange,
điều kiện cần để L(x,u) đạt cực trị có ràng buộc
f ( x , u) 0 là:
H x ( x , u) Lx ( x, u) T f x ( x , u) 0
H u ( x, u) Lu ( x, u) f u ( x , u) 0
T
H ( x , u) f ( x , u) 0
trong đó: H ( x , u) L( x , u) T f ( x, u)
© H. T. Hoàng - HCMUT 17
Tìm cực trị có ràng buộc – Thí dụ 1
Tìm cực trị hàm: L(u) 5u12 2u22 2u1u 2 8u1 3u2
Với điều kiện ràng buộc:
f (u) u1 6u2 2 0
Giải:
Hàm Hamilton:
H ( u) L ( u ) f ( u)
T
© H. T. Hoàng - HCMUT 18
Tìm cực trị có ràng buộc – Thí dụ 1
Điều kiện cần để có cực trị:
H (u)
10u1 2u2 8 0
H x ( u) 0 u1
H (u)
H u ( u) 0 2u1 4u2 3 6 0
f ( u) 0 u2
f (u) u1 6u2 2 0
Giải hệ phương trình, ta được:
u 0.8412 0.4735 0.5353
* T
250
200
150
L 100
50
-50
u* 4
6 2
4 2 0
0
u2
-2 -4 -6 -4
-2
u1
© H. T. Hoàng - HCMUT 20
Tìm cực trị có ràng buộc – Thí dụ 2
Hàm Hamilton:
H ( x, u ) L( x, u ) T f ( x, u )
H ( x, u ) ( x 2) 2 (u 2) 2 ( x 2 3 x 6 u )
© H. T. Hoàng - HCMUT 21
Tìm cực trị có ràng buộc – Thí dụ 2
Điều kiện cần để có cực trị:
H ( x, u )
2( x 2) 2x 3 0
H x ( x, u ) 0 x
H ( x, u )
H u ( x, u ) 0 2(u 2) 0
f ( x, u ) 0 u
f ( x, u ) x 3 x 6 u 0
2
H ( x , u ) L( x , u ) f ( x , u )
T
H ( x , u ) x12 3 x22 u 2 1 (2 x1 x2 4) 2 ( x1 u 2)
© H. T. Hoàng - HCMUT 23
Tìm cực trị có ràng buộc – Thí dụ 3
ĐK cần để có cực trị:
H ( x, u ) / x1 2 x1 21 2 0
H x ( x, u ) 0 H ( x, u ) / x 2 6 x2 1 0
H u ( x, u ) 0 H ( x, u ) / u 2u 2 0
f ( x, u ) 0
f1 ( x, u ) 2 x1 x2 4 0
f 2 ( x, u ) x1 u 2 0
Giải hệ phương trình, ta được:
x * 1.5714 0.8514 u * 3.5714 5.1429 7.1429T
T
Do L( x , u ) x 3 x u
2
1
2
2
2
là hàm toàn phương nên
cực trị tìm được
H ( x , u )ở
xtrên
2
1 3 cũng
x 2
2 u 2
1 (2 x1 là
chính xcực 2 ( x1 u 2)
2 4)tiểu
© H. T. Hoàng - HCMUT 24
TỐI ƯU HÓA ĐỘNG
VÀ PHƯƠNG PHÁP BIẾN PHÂN
© H. T. Hoàng - HCMUT 25
Tối ưu hóa động không ràng buộc
Bài toán tối ưu động không ràng buộc: tìm vector hàm
x(t) sao cho phiếm hàm J(x) đạt cực tiểu:
tf
J ( x ) L( x, x , t )dt min
t0
x (t ) x1 (t ) x2 (t ) xn (t ) n
T
trong
đó: L : n n
Chú ý: Phiếm hàm là hàm của hàm
(functional = function of function)
*
Phiếm hàm J ( x ) có cực tiểu cục bộ tại x (t ) nếu
J ( x (t )) J ( x (t ))
*
x (t ) x * (t )
© H. T. Hoàng - HCMUT 26
Tìm cực trị phiếm hàm?
Nhắc lại cực trị hàm:
Điều kiện cần: đạo hàm bậc 1 của hàm cần tìm cực trị
bằng 0
điểm dừng
Điểm dừng có đạo hàm bậc 2 xác định dương
điểm cực tiểu
Cực trị phiếm hàm?
Khái niệm biến phân (variation): có thể hiểu là “đạo
hàm của phiếm hàm”
Phương pháp biến phân (Calculus of Variation): dựa
vào khái niệm biến phân đưa ra điều kiện cực trị của
phiếm hàm tương tự như điều kiện cực trị hàm
© H. T. Hoàng - HCMUT 27
Khái niệm biến phân
x (t )
x (t ) x (t )
t
© H. T. Hoàng - HCMUT 28
Thí dụ tính biến phân phiếm hàm
1
© H. T. Hoàng - HCMUT 29
Công thức tính biến phân phiếm hàm dạng tích phân
J ( x ) L( x )dt
t0
Biến phân của phiếm hàm dạng tích phân được tính
như sau:
tf
L( x )
J ( x ) x dt
t0
x
© H. T. Hoàng - HCMUT 30
Biến phân phiếm hàm bài toán tối ưu động không ràng buộc
tf
Phiếm hàm: J ( x ) L( x, x , t )dt
t0
x (t0 ) x (t f ) 0
Thực hiện biến đổi tích phân, suy ra:
tf
L( x, x , t ) d L( x, x , t )
J xdt
t0
x dt x
© H. T. Hoàng - HCMUT 31
Điều kiện cần để phiếm hàm đạt cực trị cục bộ
Điều kiện cần để phiếm hàm J ( x ) đạt cực trị cục bộ
tại x * (t ) là biến phân của J ( x ) phải bằng 0 tại x * (t )
J ( x ) 0 x x *
ĐK cần để bài toán tối ưu động không ràng buộc có cực trị:
L( x, x , t ) d L( x, x , t ) L d L
0 0
x dt x x dt x
(phương trình Euler-Lagrange)
Trường hợp đặc biệt khi L không phụ thuộc tường
minh vào t, dạng đơn giản của pt Euler-Lagrange là:
t
L J L( x, x , t ) d L( x, x , t ) xdt
f
© H. T. Hoàng - HCMUT 35
Tối ưu hóa động không ràng buộc – Thí dụ 2
Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu:
2
J ( x) 1 x 2 (t )dt min với ĐK biên: x(0) 1, x(2) 0
0
Giải:
L d L
Phương trình Euler-Lagrange: 0
x dt x
1
x 1 x 2 x xx
d x 1 x 2
0
0 x 0
dt 1 x 2 1 x 2
L :
n n
f : n n p
© H. T. Hoàng - HCMUT 37
Hàm Hamilton và điều kiện cần để có cực trị
Định nghĩa hàm Hamilton:
H ( x , x , , t ) L( x, x , t ) T f ( x , x , t )
trong đó (t ) là vector hàm, gọi là thừa số Larrange
p
tf
Do f ( x , x , t ) 0 nên cực tiểu của J ( x )
tf
t0
L( x , x , t )dt
cũng chính là cực tiểu của J ( x ) t0
H ( x , x , , t )dt
9 2 9
Kết luận: x (t )
*
t t
32 8 x(t ) t 2 c1t c2
4
© H. T. Hoàng - HCMUT 43
Tối ưu hóa động có ràng buộc – Thí dụ 2
Tìm vector hàm x (t ) x1 (t ) x2 (t ) sao cho phiếm
T
hàm dưới đây đạt cực tiểu:
2
J ( x ) 5( x1 1) 2 x22 dt min
0
© H. T. Hoàng - HCMUT 44
Tối ưu hóa động có ràng buộc – Thí dụ 2
Phương trình Euler-Lagrange:
H d H
0 10( x1 1) 2 0 (1)
x1 dt x1
H d H
0 2 x2 0 (2)
x2 dt x2
Tìm nghiệm p.trình Euler-Lagrange thỏa điều kiện ràng buộc:
2 x2 (3)
(2)
2 x2
Thay (3) vào (1): 10( x1 1) 4 x2 2 x 2 0 (4)
x2 x1 2 x1
Từ điều kiện ràng buộc, suy ra: (5)
x2 x1 2 x1
Thay (5) vào (4):10( x1 1) 4( x1 2 x1 ) 2( x1 2 x1 ) 0
2 x1 H18( xx, x, 10
, t )0[5( x1 1) 2 x22 ] ( x1 2 x1 (6)
x2 )
1
© H. T. Hoàng - HCMUT 45
Tối ưu hóa động có ràng buộc – Thí dụ 2
Nghiệm tổng quát của phương trình (6)
x1 (t ) C1e 3t C 2 e 3t 0.556
Thay điều kiện biên x1 (0) 0; x1 (2) 1
C1 C 2 0.556 0 C1 0.5549
0.0025C1 403.42C 2 0.556 1 C 2 0.0011
x1 (t ) 0.5549e 3t 0.0011e 3t 0.556 (7)
© H. T. Hoàng - HCMUT 46
ĐIỀU KHIỂN TỐI ƯU LIÊN TỤC
DÙNG PHƯƠNG PHÁP BIẾN PHÂN
© H. T. Hoàng - HCMUT 47
Bài toán điều khiển tối ưu liên tục
Cho đối tượng: x (t ) f ( x (t ), u(t )) (*)
Bài toán ĐK tối ưu: tìm tín hiệu ĐK u(t) sao cho:
tf
Nghiệm x*(t) của phương trình vi phân (*) ứng với tín
hiệu ĐK tối ưu u*(t) gọi là quỹ đạo trạng thái tối ưu.
© H. T. Hoàng - HCMUT 48
Phân loại bài toán điều khiển tối ưu
Khoảng thời gian xảy ra quá trình tối ưu là tf , có thể phân
loại:
Bài toán tối ưu có tf cố định, ví dụ:
Điều khiển đoàn tàu hỏa giữa 2 ga với lịch trình xác
định sao cho năng lượng đoàn tàu tiêu thụ là thấp
nhất;
Điều khiển quá trình chuyển đổi hóa học trong thời
gian cho trước với chi phí thấp nhất
Bài toán tối ưu có tf không cố định, ví dụ:
Điều khiển tên lửa lên độ cao xác định với thời gian
nhanh nhất
Điều khiển tàu biển đi được xa nhất với một nguồn
năng lượng cố định cho trước
© H. T. Hoàng - HCMUT 49
Phân loại bài toán điều khiển tối ưu (tt)
Các bài toán điều khiển tối ưu động có trạng thái đầu x0
cho trước. Trạng thái cuối quá trình tối ưu là xf =x(tf), có
thể phân loại:
Điểm cuối tự do, ví dụ:
Điều khiển tên lửa lên độ cao lớn nhất;
Điều khiển tàu biển đi được xa nhất với một nguồn
năng lượng cố định cho trước
Điểm cuối bị ràng buộc, ví dụ:
Điều khiển tên lửa vào quỹ đạo với thời gian nhanh
nhất.
Điểm cuối cố định cho trước, ví dụ:
Điều khiển ghép nối các con tàu
Điều khiển hệ thống về trạng thái cân bằng
© H. T. Hoàng - HCMUT 50
Giải bài toán ĐK toán tối ưu dùng PP biến phân
Bài toán ĐK tối ưu liên tục có thể phát biểu lại như sau:
tf
Kết hợp điều kiện ràng buộc vào hàm mục tiêu dùng hàm
Lagrange:
tf
© H. T. Hoàng - HCMUT 51
Giải bài toán ĐK toán tối ưu dùng PP biến phân
Định nghĩa hàm Hamilton:
H ( x , u, t , ) L( x , u, t ) T (t ) f ( x , u, t )
tf
J ( u) ( x (t f )) [ H ( x, u, t , ) T (t ) x ]dt
t0
© H. T. Hoàng - HCMUT 52
Điều kiện cần để có lời giải bài toán ĐK tối ưu
Chú ý là x (t0 ) 0 do điều kiện đầu cố định; x (t f ) 0
nếu điểm cuối ràng buộc, x (t f ) 0 nếu điểm cuối tự do
Để J ( u) 0 với mọi u cần có các điều kiện:
H H (t f )
0 (t) (t f )
u x x
Lưu ý:
(t f )
Điều kiện (t f ) chỉ cần đối với bài toán
x
điểm cuối tự do.
(t ) được gọi là đồng trạng thái của hệ thống
tf
H
(t) T
được gọi là phương
J ( u ) ( xtrình
(t f )) đồng
[ H (ttrạng
) (tthái
) x ]dt
x 0
© H. T. Hoàng - HCMUT 53
Trình tự giải bài toán điều khiển tối ưu
Bước 1: Viết PTTT mô tả đối tượng:x (t ) f ( x (t ), u(t ), t )
Bước 2: Viết hàm mục tiêu và ĐK biên từ yêu cầu thiết kế
Bài toán điểm cuối tự do:
tf
© H. T. Hoàng - HCMUT 56
Điều khiển tối ưu – Thí dụ 1 (tt)
Bước 2: Xác định hàm mục tiêu và điều kiện biên:
Theo yêu cầu thiết kế là trạng thái cuối x(tf ) càng gần xf =50
càng tốt, đồng thời tối thiểu năng lượng tiêu tốn, suy ra hàm
mục tiêu: 1
tf
1 2
J (u ) [ x(t f ) x f ] u (t )dt min
2
2 20
(Đây là bài toán tối ưu điểm cuối tự do)
trong đó là trọng số tùy chọn (muốn trạng thái cuối càng
gần xf thì chọn càng lớn)
Điều kiện đầu: x0 0; t f 1
Bước 3: Định nghĩa hàm Hamilton:
H ( x, u, , t ) L( x, u, t ) (t ) f ( x , u, t )
1 2
H ( x , u, , t ) u (t ) (t )[2 x(t ) u (t )]
2
© H. T. Hoàng - HCMUT 57
Điều khiển tối ưu – Thí dụ 1 (tt)
Bước 4: Điều kiện cần để có nghiệm tối ưu
PT trạng thái: x (t ) 2 x(t ) u (t ) (1)
H (2)
PT đồng trạng thái: (t ) (t ) 2 (t )
x
Điều kiện dừng: H
0 u (t ) (t ) 0 (3)
u
1 2
H ( x , u, , t ) u (t ) (t )[2 x(t ) u (t )]
2
© H. T. Hoàng - HCMUT 58
Điều khiển tối ưu – Thí dụ 1 (tt)
Bước 5: Giải phương trình vi phân
Nghiệm phương trình (2):
(t ) C1e 2t (6)
C1 2t
x(t ) e C2 e 2t
4
© H. T. Hoàng - HCMUT 59
Điều khiển tối ưu – Thí dụ 1 (tt)
Xác định các hằng số dựa vào điều kiện biên:
x ( 0) 0
(1) x(1) 50
C1
4 C2 0
C1e e C2 e 2 50
2 C1 2
4
50
C1 e 2 (e 2 e 2 ) / 4
12.5
C2
e 2 ( e 2 e 2 ) / 4
© H. T. Hoàng - HCMUT 60
Điều khiển tối ưu – Thí dụ 1 (tt)
Kết luận: Tín hiệu điều khiển và quỹ đạo trạng thái tối ưu là:
u (t ) C1e 2t
C1 2t
x(t ) e C2 e 2t
4
© H. T. Hoàng - HCMUT 61
Điều khiển tối ưu – Thí dụ 2
Cho hệ thống xe như hình vẽ. y(t)
Quan hệ vào ra của hệ thống u(t)
mô tả bởi phương trình vi phân: M
My(t ) u(t )
trong đó u(t) là tín hiệu vào (lực điều khiển); y(t) là tín hiệu ra
(vị trí xe); m = 0.5kg là khối lượng xe
Bài toán đặt ra là thiết kế luật điều khiển u(t) để điều khiển xe
từ trạng thái đứng yên tại gốc tọa độ đến trạng thái đứng yên
tại vị trí cách gốc tọa độ 10cm trong khoảng thời gian 1 giây,
đồng thời tối thiểu năng lượng tiêu tốn.
Yêu cầu:
Hãy thành lập bài toán tối ưu cho yêu cầu thiết kế trên.
Giải bài toán tìm tín hiệu điều khiển tối ưu
© H. T. Hoàng - HCMUT 62
Điều khiển tối ưu – Thí dụ 2
Giải:
Bước 1: Viết phương trình trạng thái của đối tượng
Đặt các biến trạng thái x1 (t ) y (t ), x2 (t ) y (t )
Phương trình trạng thái mô tả đối tượng
x1 (t ) x 2 (t )
x (t ) 1 u(t )
2 M
x1 (t ) x2 (t )
x 2 (t ) 2u(t )
© H. T. Hoàng - HCMUT 63
Điều khiển tối ưu – Thí dụ 2
Bước 2: Xác định hàm mục tiêu và điều kiện biên:
Yêu cầu thiết kế là trạng thái xe tại thời điểm tf = 1 đứng yên
tại vị trí 10cm (điểm cuối ràng buộc) đồng thời tối thiểu năng
lượng tiêu tốn, suy ra hàm mục tiêu:
1
1 2 (Bài toán tối ưu
J (u ) u (t )dt min
20 điểm cuối ràng buộc)
Từ dữ kiện của đề bài, có thể xác định được điều kiện biên:
Điều kiện đầu: x1 (0) y (0) 0, x2 (0) y (0) 0
Điều kiện cuối:x1 (1) y (1) 10, x2 (1) y (1) 0
Bước 3: Thành lập hàm Hamilton:
H ( x , u, , t ) L( x , u, t ) T (t ) f ( x , u, t )
1 2
H ( x, u, , t ) u (t ) 1 x 2 (t ) 2 2u(t )
2
© H. T. Hoàng - HCMUT 64
Điều khiển tối ưu – Thí dụ 2 (tt)
Bước 4: Điều kiện cần để có nghiệm tối ưu
x1 (t ) x2 (t ) (1)
PT trạng thái:
x 2 (t ) 2u(t )
H
1 ( t ) 0
x1
PT đồng trạng thái: (2)
2 (t ) H 1
x 2
H u ( t ) 2 2 ( t ) 0
Điều kiện dừng: 0 (3)
u
x (0) 0;0
T
Điều kiện đầu: (4)
x (1) 10;0 (5)
T
Điều kiện cuối:
© H. T. Hoàng - HCMUT 65
Điều khiển tối ưu – Thí dụ 2 (tt)
Bước 5: Giải phương trình vi phân
1 (t ) C1
Nghiệm phương trình (2): (6)
2 (t ) C1t C 2
Nghiệm phương trình (3):
u(t ) 22 (t ) 2C1t 2C 2 (7)
Thay (7) vào (1), ta được:
x1 (t ) x 2 (t )
x 2 (t ) 2u (t ) 4C1t 4C 2
x1 (t ) 23 C1t 3 2C 2 t 2 C3t C 4
(9)
x
2 ( t ) 2 C1 t 2
4C 2 t C3
© H. T. Hoàng - HCMUT 66
Điều khiển tối ưu – Thí dụ 2 (tt)
Thay điều kiện biên:
x1 (0) C 4 0 C 4 0
x 2 (0) C3 0 C 0
3
x (1) 2 C 2C 10
1 3 1 2
C1 30
x 2 (1) 2C1 4C 2 0 C 2 15
© H. T. Hoàng - HCMUT 67
PHƯƠNG PHÁP QUI HOẠCH ĐỘNG
© H. T. Hoàng - HCMUT 68
Nguyên lý tối ưu Bellman
Phương pháp qui hoạch động (DP – Dynamic
Programing) do Bellman đề xuất (1957)
Phương pháp qui hoạch động là một thuật toán xác định
dãy giá trị {u(k)} tối ưu để tối thiểu chỉ tiêu chất lượng J.
Nguyên lý tối ưu: Mỗi đoạn cuối của quỹ đạo trạng thái
tối ưu cũng là một quỹ đạo trạng thái tối ưu.
x2
Đoạn 2
Đoạn 3 xN
xk Đoạn 1
x0
x1
© H. T. Hoàng - HCMUT 69
Thí dụ tìm đường ngắn nhất dùng DP
Tìm đường ngắn nhất đi từ A đến J, cho biết mạng
lưới đường như hình vẽ.
N42
N33
N23
Ký hiệu:
*
J k ( N ki ) là khoảng cách ngắn nhất từ nút N ki đến nút đích J
d ( N ki , N k 1, j ) là khoảng cách từ nút N ki đến nút N k 1, j
Phương trình Bellman: J k* ( N ki ) min d ( N ki , N k 1, j ) J k*1 ( N k 1, j )
j
J1* ( N11 ) là khoảng cách ngắn nhất từ nút đầu đến nút đích.
© H. T. Hoàng - HCMUT 72
Thí dụ tìm đường ngắn nhất dùng DP
Vòng ngược:
Bước 5: bắt đầu từ nút đích J 5* ( N 51 ) 0
Bước 4: đoạn đường ngắn nhất từ nút N41 hoặc N42
đến đích:
J 4* ( N 41 ) d ( N 41 , N 51 ) J 5* ( N 51 ) 3
J 4* ( N 42 ) d ( N 42 , N 51 ) J 5* ( N 51 ) 4
© H. T. Hoàng - HCMUT 74
Thí dụ tìm đường ngắn nhất dùng DP (tt)
Bước 3: có nhiều lựa
chọn, từ nút N3i phải
chọn đường đi đến
đích qua nút N4j nào
tối ưu đoạn quỹ đạo
cuối J 3* ( N 3i ) ?
J 3* ( N 3i ) mind ( N 3i , N 4 j ) J 4* ( N 4 j )
j
Từ nút
d ( N 3i , N 4j ) J *
4 (N4 j ) * Quyết định
J ( N 3i )
3 đi đến
N3i N 41 N 42
N 31 1+3=4 4+4=8 4 N41 (H)
N 32 6+3=9 3+4=7 7 N42 (I)
N 33 3+3=6 3+4=7 6 N41 (H)
© H. T. Hoàng - HCMUT 75
Thí dụ tìm đường ngắn nhất dùng DP (tt)
Bước 2: tìm đường
tối ưu từ nút N2i đến
nút đích N51 (tức nút J 3* ( N 31 ) 4
J), sử dụng kết quả J 3* ( N 32 ) 7
tối ưu đoạn cuối tìm J 3* ( N 33 ) 6
được ở bước 3
J 2* ( N 2i ) mind ( N 2i , N 3 j ) J 3* ( N 3 j )
j
Từ nút
d ( N 2i , N 3 j ) J 3* ( N 3 j ) * Quyết định
J ( N 2i )
2 đi đến
N2i N 31 N 32 N 33
N 21 7+4=11 4+7=11 6+6=12 11 N 31 hoặc N 32
N 22 3+4=7 2+7=9 4+6=10 7 N 31
N 23 4+4=8 1+7=8 5+6=11 8 N 31 hoặc N 32
© H. T. Hoàng - HCMUT 76
Thí dụ tìm đường ngắn nhất dùng DP (tt)
Bước 1: tìm đường
tối ưu từ nút N11 (tức J 2* ( N 21 ) 11
nút A) đến nút đích J 2* ( N 22 ) 7
N51 (tức nút J), sử J 2* ( N 23 ) 8
dụng kết quả tối ưu
đoạn cuối tìm được
ở bước 2
J1* ( N11 ) min d ( N11 , N 2 j ) J 2* ( N 2 j )
j
Từ d ( N11 , N 2 j ) J 2* ( N 2 j ) *
Quyết định
J ( N11 )
1 đi đến
N 21 N 22 N 23
N11 2+11=13 4+7=11 2+8=10 10 N 23
© H. T. Hoàng - HCMUT 77
Thí dụ tìm đường ngắn nhất dùng DP (tt)
Kết luận:
Đường đi tối ưu: N11 N 23 N 31 N 41 N 51
hoặc: N11 N 23 N 32 N 42 N 51
© H. T. Hoàng - HCMUT 78
Bài toán điều khiển tối ưu động rời rạc
Cho đối tượng mô tả bởi phương trình sai phân:
x (k 1) f ( x (k ), u(k )) (*)
trong đó: x (k ) [ x1 (k ), x2 (k ),..., xn (k )]T: vector trạng thái
u(k ) [u1 (k ), u2 (k ),..., um (k )]T: vector tín hiệu điều khiển
Trạng thái đầu: x (0) x0 , trạng thái cuối: x ( N ) x N
Bài toán điều khiển tối ưu: tìm tín hiệu u(k) sao cho:
N 1
J ( N , x N ) L( x (k ), u(k )) min
k 0
với J N* ( x ( N )) ( N , x N )
Bước 2: Giải phương trình Bellman qua 2 vòng:
Vòng ngược: k N 1 0 tìm u ( k ) phụ thuộc x (k )
*
© H. T. Hoàng - HCMUT 81
Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt)
*
Vòng ngược: tìm u (k ) phụ thuộc x(k) (k=N10), gồm các
bước:
Tìm u* ( N 1) phụ thuộc x ( N 1) là nghiệm bài toán tối ưu:
J N* 1 ( x ( N 1)) min L( x ( N 1), u( N 1)) ( N , x ( N ))
u ( N 1)
với J k*1 (.) là biểu thức hàm mục tiêu tối ưu tối ưu đoạn quỹ
đạo cuối đã tìm được ở bước trước đó.
J k (.)
*
Chú ý: để tìm u ( k ) , áp dụng PP tối ưu tĩnh, giải PT: 0
u(k )
© H. T. Hoàng - HCMUT 82
Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt)
*
Vòng xuôi: xác định giá trị cụ thể uk (k ) . Thực hiện các bước
sau đây với k=0,1,2,….N1:
x (k 1) f ( x (k ), u* (k ))
© H. T. Hoàng - HCMUT 83
Điều khiển tối ưu rời rạc dùng DP – Thí dụ 1
Xét đối tượng là khâu quán tính bậc 1 có mô hình trạng thái:
1 1
x(k 1) x(k ) u (k )
2 2
Xác định tín hiệu điều khiển tối ưu để điều khiển hệ thống từ
trạng thái đầu x(0)=4 đến trạng thái cuối x(4)=0 sao cho:
3
J ( x 2 (k ) u 2 (k )) min
k 0
Giải:
Phương trình Bellman:
J k* ( x (k )) min L( x (k ), u(k )) J k*1 ( f ( x (k ), u(k )))
u( k )
J k* ( x(k )) minx (k ) u
2 2
(k ) J k*1 (0.5 x(k ) 0.5u (k )) (k 0 3)
u(k )
với: J 4* ( x(4)) 0
© H. T. Hoàng - HCMUT 84
Điều khiển tối ưu rời rạc dùng DP – Thí dụ 1 (tt)
Vòng ngược: Với k = 3:
Phương trình Bellman:
u ( 3)
J 3* ( x(3)) min x 2 (3) u 2 (3) (do J 4* ( x(4)) 0 )
Lời giải: u * (3) x(3) (để thỏa mãn điều kiện ràng buộc)
J 3* ( x(3)) 2 x 2 (3)
© H. T. Hoàng - HCMUT 85
Điều khiển tối ưu rời rạc dùng DP – Thí dụ 1 (tt)
Vòng ngược: Với k = 2:
Phương trình Bellman:
J 2* ( x(2)) min x 2 (2) u 2 (2) J 3* ( x(3))
u ( 2)
J 2* ( x(2)) minx (2) u
2 2
(2) 2 x 2 (3)
u ( 2)
1 1
2
J 2 ( x(2)) min x (2) u (2) 2 x(2) u (2))
* 2 2
u ( 2)
2 2
3 2 3 2
J 2 ( x(2)) min x (2) x(2)u (2) u (2)
*
u ( 2) 2 2
J 2 (.) x ( 2)
Do x(2) 3u (2) u * (2)
u (2) 3
2 2
© H. T. Hoàng - HCMUT 86
Điều khiển tối ưu rời rạc dùng DP – Thí dụ 1 (tt)
Vòng ngược: Với k = 1:
Phương trình Bellman:
J1* ( x(1)) minx 2 (1) u 2 (1) J 2* ( x(2))
u (1)
2 4 2
J1 ( x(1)) min
*
x (1) u (1) x (2)
2
u (1)
3
4 1
2
J1 ( x(1)) min x (1) u (1) ( x(1) u (1))
* 2 2
u (1)
3 2
J1* ( x(1)) min x 2 (1) x(1)u (1) u 2 (1)
4 2 4
u (1)
3 3 3
J (.) 2 8 x(1)
Do: 1 x(1) u (1) u * (1)
u (1) 3 3 4
2 2
x(1) 4 1 x(1)
J1* ( x(1)) x 2 (1) 2 x (1)
4 3 4
5
J1* ( x(1)) x 2 (1)
4
© H. T. Hoàng - HCMUT 87
Điều khiển tối ưu rời rạc dùng DP – Thí dụ 1 (tt)
Vòng ngược: Với k = 0:
Phương trình Bellman:
J 0* ( x(0)) min x 2 (0) u 2 (0) J1* ( x(1))
u0 1
u (0) 8 8 21
2 2
5 20
Với k = 0: u (0) x(0)
*
21 21
1 1 20 32
x(1) ( x(0) u (0)) 4
*
2 2 21 21
x(1) 8
Với k = 1: u * (1)
4 21
1 1 32 8 12
x(2) ( x(1) u (1))
*
2 2 21 21 21
© H. T. Hoàng - HCMUT 89
Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt)
Vòng xuôi:
x(2) 4
Với k = 2: u (2)
*
3 21
1 1 12 4 4
x(3) ( x(2) u * (2))
2 2 21 21 21
4
Với k = 3: u * (3) x(3)
21
1 1 4 4
x(4) ( x(3) u (3)) 0
*
2 2 21 21
20 8 4 4
Kết luận: Chuổi tín hiệu ĐK tối ưu là: u ; ; ;
*
21 21 21 21
26 2 416
Chỉ tiêu chất lượng tối ưu: J min J 0* ( x(0)) x (0)
21 21
© H. T. Hoàng - HCMUT 90
Qui hoạch động giải bài toán ĐK tối ưu liên tục
Cho đối tượng mô tả bởi phương trình trạng thái:
x (t ) f ( x (t ), u(t ), t )
Trạng thái đầu: x (0) x0 , trạng thái cuối: x (t f ) x f
Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(t) sao cho:
tf
J (u) ( x (t f )) L( x (t ), u(t ), t )dt min (*)
ti
Đặt: Hàm mục tiêu tối ưu đoạn quỹ đạo cuối từ thời điểm ti,
trạng thái xi đến thời điểm cuối tf, trạng thái cuối x(tf) là
J (ti , xi ) min ( x (t f )) L( x (t ), u(t ), t )dt
tf
*
u(t ) ti
Nếu tồn tại lời giải tối ưu của bài toán (*) thì hàm mục tiêu tối ưu đoạn
quỹ đạo cuối phải thỏa mãn PT Hamilton-Jacobi-Bellman:
T
J (t , x )
*
J (t , x )
*
minL( x, u, t ) f ( x, u, t )
t u(t )
x
© H. T. Hoàng - HCMUT 91
ĐIỀU CHỈNH TOÀN PHƯƠNG TUYẾN TÍNH
(Linear Quadratic Regulator – LQR)
© H. T. Hoàng - HCMUT 92
Bài toán LQR liên tục
Đối tượng tuyến tính mô tả bởi phương trình trạng thái:
x (t ) Ax (t ) Bu(t ) (*)
trong đó: x (t ) [ x1 (t ), x2 (t ),..., xn (t )]T : vector trạng thái
u(t ) [u1 (t ), u2 (t ),..., um (t )]T : vector tín hiệu điều khiển
Bài toán đặt ra là tìm tín hiệu ĐK u(t) điều chỉnh hệ thống từ
trạng thái đầu x (0) x0 bất kỳ về trạng thái cuối x(tf) = 0 sao
cho tối thiểu chỉ tiêu chất lượng dạng toàn phương:
tf
1 T
2
1
J (u) x (t f ) Mx (t f ) x T (t )Qx (t ) uT (t ) Ru(t ) dt
2 t0
trong đó Q và M là các ma trận trọng số bán xác định dương
R là ma trận trọng số xác định dương
Bài toán trên được gọi là bài toán điều chỉnh toàn phương tuyến tính.
© H. T. Hoàng - HCMUT 93
Điều kiện cực trị bài toán LQR liên tục
Hàm Hamilton:
1 T
H x (t )Qx (t ) uT (t ) Ru(t ) T (t )Ax (t ) Bu(t )
2
Điều kiện cần để có lời giải tối ưu:
PT trạng thái: x (t ) Ax (t ) Bu(t ) (1)
H
PT đồng trạng thái: (t ) Qx (t ) A (t ) (2)
x
H
Điều kiện dừng: Ru(t ) B T (t ) 0x (t ) f ( x (t ), u(t ),(3)
t)
u
H
(t )
T
x
H
0 T
H (t ) L( x, u , t ) (t ) f ( x , u, t )
© H. T. Hoàng - HCMUT 94
Cách tìm lời giải tối ưu
Rút u(t) từ (3):
u(t ) R 1 B T (t ) (4)
Thay (4) vào (1), ta được
x (t ) Ax (t ) BR 1 B T (t ) (5)
Kết hợp (5) và (2), ta được phương trình vi phân:
x (t ) A BR 1 B T x (t )
(t ) Q (t ) (6)
A
Giải phương trình vi phân (6), tìm được x(t) và (t)
Thay (t) vào (4) tìm được lời giải tối ưu
© H. T. Hoàng - HCMUT 95
Lời giải bài toán LQR liên tục
P PA AT P Q PBR 1 B T P
P (t f ) M
© H. T. Hoàng - HCMUT 96
Bài toán LQR liên tục thời gian vô hạn
Đối tượng tuyến tính mô tả bởi phương trình trạng thái:
x (t ) Ax (t ) Bu(t )
Chỉ tiêu chất lượng dạng toàn phương, với thời điểm cuối tf=:
1
J (u) x T (t )Qx (t ) uT (t ) Ru(t ) dt
20
Tín hiệu điều khiển tối ưu: u* (t ) Kx (t )
trong đó: K R 1 B T P
và P là nghiệm bán xác định dương của p.trình đại số Ricatti:
PA AT P Q PBR 1 B T P 0
Chú ý: trong trường hợp này K và P là không phụ thuộc thời gian
Giá trị cực tiểu của chỉ tiêu chất lượng: J min x T (0) Px (0)
© H. T. Hoàng - HCMUT 97
Điều khiển LQR liên tục – Thí dụ 1
Cho hệ tuyến tính bậc 1 không ổn định mô tả bởi PTTT:
x (t ) 3x(t ) 2u (t )
Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối
thiểu chỉ tiêu chất lượng:
1
J ( x 2 (t ) 5u 2 (t ))dt
20
Giải:
Phương trình đại số Ricatti: PA AT P Q PBR 1 B T P 0
1 4 2
P.3 3.P 1 P.2. .2.P 0 P 6P 1 0
5 5
P 7.663 (chọn nghiệm xác định dương)
1
Độ lợi hồi tiếp trạng thái: K R B P K .2.(7,663) 3,065
1 T
5
Luật điều khiển tối ưu: u (t ) Kx (t ) u (t ) 3,065 x(t )
© H. T. Hoàng - HCMUT 98
Điều khiển LQR liên tục – Thí dụ 2
x1 x2
Cho hệ tuyến tính bậc 2 mô tả bởi PTTT:
x2 u
Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối
thiểu chỉ tiêu chất lượng:
1
J (2 x12 (t ) 2u 2 (t ))dt
Giải: 20
x1 (t ) 0 1 x1 (t ) 0
Viết lại phương trình trạng thái: u (t )
x2 (t ) 0 0 x2 (t ) 1
A B
Viết lại chỉ tiêu chất lượng:
1 2 0 x1
J x1 x2 2 2
(t ))dt
u
20 0 0 x2 R
Q
© H. T. Hoàng - HCMUT 99
Điều khiển LQR liên tục – Thí dụ 2
Phương trình đại số Ricatti:
PA AT P Q PBR 1 B T P 0
p1 p2 0 1 0 0 p1 p2 2 0
p2 p3 0 0 1 0 p2
p3 0 0
p1 p 2 0 1 p1 p2
0 1 0
p2 p3 1 2 p2 p3
0 p1 0 0 2 0 1 p22 p2 p3
2
0
0 p2 p1 p2 0 0 2 p2 p3 p3
1 2 1
2 p2 p1 p2 p3
2 2 0
1 1
p1 p2 p3 2 p2 p32
2 2
© H. T. Hoàng - HCMUT 100
Điều khiển LQR liên tục – Thí dụ 2
1 2
2 2 p 2 0 p1 2 2
1 2 2 2
p1 p2 p3 0 p2 2 P
2 p 2 2 2 2 2
2 p2 1 p32 0 3
2
p1 p2 0 1 0 1 p1 p2 2 0
p2 p3 1 2 1 2 p2
p3 0 1
p p 2 0 p1 p2
1 0 1 0
p2 p3 1 p2
p3
p2 p1 2 p2 p2 p3 2 0 p22 p2 p3
2
0
p3 p2 2 p3 p1 2 p2 p2 2 p3 0 1 p2 p3 p3
2 p2 2 p22 p1 2 p2 p3 p2 p3
2
0
p3 p1 2 p2 p2 p3 2 p2 4 p3 1 p3
2 p2 2 p22 0 p1 2.403
p 2 p p p p 0 (chọn các
1 2 3 2 3 p2 0.732 nghiệm
p p1 2 p2 p2 p3 0 p 0.542
3 dương)
2 p2 4 p3 1 p32 0 3
2.403 0.732
P
0.732 0.542
Độ lợi hồi tiếp trạng thái:
2.403 0.732
K R B P K 0 1
1 T
K [0.732 0.542]
0.732 0.542
x1 (t )
Luật điều khiển tối ưu: u (t ) Kx (t ) [0.732 0.542]
*
x (t )
2
u * (t ) 0.732 x1 (t ) 0.542 x2 (t )
© H. T. Hoàng - HCMUT 104
Bài toán LQR rời rạc
Cho đối tượng tuyến tính rời rạc mô tả bởi phương trình trạng
thái: x (k 1) A x (k ) B u(k ) (*)
d d
và P(k) là nghiệm bán xác định dương của phương trình Ricatti:
P ( k ) A P ( k 1) P ( k 1) Bd B P ( k 1) Bd R
T
d
T
d
1
BdT P ( k 1) Ad Q
P (N ) M
Nghiệm p/trình Ricatti rời rạc: lần lượt thay k ( N 1) 0
vào phương trình Ricatti sẽ tìm được P(k)
Lời giải bài toán LQR (Linear Quadratic Regulator) liên tục
>> K=lqr(A,B,Q,R)
xˆ (t ) [ Axˆ (t ) Bu (t )] L[ y (t ) yˆ (t )]
Bộ lọc Kalman liên tục:
yˆ (t ) Cxˆ (t )
Trong đó L là độ lợi của bộ lọc Kalman:
L C T RN1
với là nghiệm của phương trình Ricatti:
A AT C T RN1C Q N 0
© H. T. Hoàng - HCMUT 111
Sơ đồ khối bộ lọc Kalman liên tục
L
+
xˆ (t )
B ++
+ C
yˆ (t )
xˆ (t ) Axˆ (t ) Bu (t ) L( y (t ) yˆ (t ))
Bộ lọc Kalman:
yˆ (t ) Cxˆ (t )
0 1 p1 p2 p1 p2 0 1 0.2 0
1 2 p2
p3 p2
p3 1 2 0 0.1
p1 p2 1 1 p1 p2
1 0 0
p2 p3 0 0.01 p2
p3
p2 p3 p2 p1 2 p2 0.2 0
p1 2 p2
p2 2 p3 p3 p2 2 p3 0 0.1
p12 p1 p2
100 2 0
p1 p2 p2
+
L
xˆ (t )
Bd ++
+ z 1 Cd
yˆ (t )
Ad
Bộ lọc Kalman:
xˆ (k 1) [ Ad xˆ (k ) Bd u (k )] Lk [ y (k 1) yˆ (k 1)]
yˆ (k ) C xˆ (k )
d
Trong đó:
L(k ) Ad (k )C dT C d (k )C dT RN
1
Bài toán đặt ra là tìm tín hiệu ĐK u(t) điều chỉnh hệ thống từ
trạng thái đầu x (0) x0 bất kỳ về trạng thái cuối x(tf) = 0 sao
cho tối thiểu chỉ tiêu chất lượng dạng toàn phương:
1 T
J (u) E x (t )Qx (t ) u (t ) Ru(t ) dt
T
2 0
trong đó Q là các ma trận trọng số bán xác định dương
R là ma trận trọng số xác định dương
© H. T. Hoàng - HCMUT 120
Nguyên lý tách rời
Nguyên lý tách rời: Bài toán tối ưu LQG có thể giải bằng cách
giải riêng bài toán điều khiển tối ưu tiền định và bài toán ước
lượng trạng thái tối ưu.
+
L
xˆ (t )
B ++
+ C
yˆ (t )
[rad],[rad/s]
1 0 0 0
0
0 1 0 0 -0.5
Q
0 1 2 3 4 5 6
1
0 0 1 0 x
[m],[m/s]
0.5 x
0 0 0 1 0
-0.5
R 1 10
0 1 2 3 4 5 6
u
5
[N]
-5
Góc lệch con lắc 0 1 2 3 4 5 6
Time [s]
được giữ cân bằng
tốt, tuy nhiên vị trí xe K= [34.3620 10.7009 1.000 2.4109]
dao động khá lớn
© H. T. Hoàng - ÐHBK TPHCM 130
Kết quả mô phỏng điều khiển LQR hệ con lắc ngược
0.5
[rad],[rad/s]
0
1 0 00 -0.5
0 1 0 0 -1
Q
0 1 2 3 4 5 6
2
0 0 100 0 x
[m],[m/s]
1 x
0 0 0 1 0
-1
R 1 20
0 1 2 3 4 5 6
u
10
Tăng trọng số q33
[N]
0
(tương ứng với vị trí -10
xe) vị trí xe ít dao 0 1 2 3
Time [s]
4 5 6
0.5
[rad],[rad/s]
0
1 0 0 0 -0.5
0 1 0 0 -1
Q
0 1 2 3 4 5 6
2
0 0 100 0 x
x
[m],[m/s]
1
0 0 0 1 0
-1
R 1 0 1 2 3 4 5 6
20
u
10
Khuyết điểm của bộ
[N]
0
điều khiển LQR là -10
nếu có nhiễu đo 0 1 2 3
Time [s]
4 5 6
Bộ lọc Kalman
Q N 0.000001I 6.5617 0.0571
21.5437 0.1876
0.001 0
L
RN 0.5713 0.1470
0 0 .01
1.9568 0.0271
(Do ta giả sử không có nhiễu hệ thống nên chọn QN rất bé. Hai
thành phần của RN chính là phương sai của nhiễu đo lường)
© H. T. Hoàng - ÐHBK TPHCM 134
Mô phỏng điều khiển LQG hệ con lắc ngược
[rad],[rad/s]
0
-1
-2
0 1 2 3 4 5 6
2
x
x
[m],[m/s]
-2
0 1 2 3 4 5 6
10
u
0
[N]
-10
0 1 2 3 4 5 6
Time [s]
Bộ lọc Kalman ước lượng trạng thái và lọc nhiễu, nhờ vậy mà
đáp ứng của hệ thống điều khiển LQG tốt hơn LQR trong
trường hợp hệ thống có nhiễu
© H. T. Hoàng - ÐHBK TPHCM 136
MỘT SỐ CÔNG THỨC CẦN NHỚ
Cách 1: (t ) e At L1 ( sI A) 1
Cách 2:(t ) e At C0 I C1 A C2 A2 Cn 1 An 1
thay các trị riêng i của ma trận A (nghiệm của det(I A) 0 )
vào phương trình trên sẽ tính được các hệ số Ci
© H. T. Hoàng - HCMUT 144
Nghiệm của phương trình trạng thái (tt)
Các trường hợp riêng của phương trình vi phân bậc 1:
Nếu B=0: x (t ) Ax (t )
x(t ) (t ) x(t0 ) e A(t t0 ) x(t0 )
Nếu u=1: x (t ) Ax (t ) B
t
x(t ) (t ) x(t0 ) (t ) Bd
t0
Sau khi học xong chương 3, sinh viên phải có khả năng:
Giải bài toán tối ưu động không ràng buộc và có ràng buộc
Thành lập các bài toán điều khiển tối ưu động
Giải bài toán tối ưu động liên tục dùng phương pháp biến
phân
Giải bài toán tối ưu rời rạc dùng phương pháp qui hoạch
động
Thiết kế bộ điều khiển LQR, bộ lọc Kalman, bộ điều khiển
LQG