Professional Documents
Culture Documents
Duoi VI Phan Va Ung Dung - 240525
Duoi VI Phan Va Ung Dung - 240525
Duoi VI Phan Va Ung Dung - 240525
• ∅ ̸= Ω ⊂ Rn là tập lồi
1
Nón pháp tuyến tới tập lồi
• ∅ ̸= Ω ⊂ Rn là tập lồi
• v̄ ∈ Ω
1
▶ Nếu v̄ ∈ int Ω thì NΩ (v̄ ) = 0.
2
▶ Nếu v̄ ∈ int Ω thì NΩ (v̄ ) = 0.
▶ Nếu v̄ ∈
/ Ω thì NΩ (v̄ ) := ∅.
2
Hàm lồi chính thường
Đặt R̄ = R ∪ {∞}
Định nghĩa
Hàm số f : Rn → R̄ được gọi là chính thường (proper) a nếu
f (x) > −∞ với mọi x và tồn tại x sao cho f (x) < +∞.
a
Subsection 3.2.3, M.S. Bazaraa, H.D. Sherali, C.M. Shetty (2006), Nonlinear
Programming: Theory and Algorithms, Wiley.
3
Dưới vi phân
• ∅ ̸= Ω ⊂ Rn : tập lồi
1
Definition 2.52, M.S. Bazaraa, H.D. Sherali, C.M. Shetty (2006), Nonlinear
Programming: Theory and Algorithms, Wiley.
4
Dưới vi phân
• ∅ ̸= Ω ⊂ Rn : tập lồi
• f : Rn → R̄: hàm lồi chính thường
1
Definition 2.52, M.S. Bazaraa, H.D. Sherali, C.M. Shetty (2006), Nonlinear
Programming: Theory and Algorithms, Wiley.
4
Dưới vi phân
• ∅ ̸= Ω ⊂ Rn : tập lồi
• f : Rn → R̄: hàm lồi chính thường
• |f (x̄)| < ∞
1
Definition 2.52, M.S. Bazaraa, H.D. Sherali, C.M. Shetty (2006), Nonlinear
Programming: Theory and Algorithms, Wiley.
4
Dưới vi phân
• ∅ ̸= Ω ⊂ Rn : tập lồi
• f : Rn → R̄: hàm lồi chính thường
• |f (x̄)| < ∞
1
Definition 2.52, M.S. Bazaraa, H.D. Sherali, C.M. Shetty (2006), Nonlinear
Programming: Theory and Algorithms, Wiley.
4
¬ Tập hợp tất cả các dưới vi phân của f tại x̄ được gọi là dưới
vi phân của hàm số tại x̄, ký hiệu là ∂f (x̄).
5
Các tính chất của tập dưới vi phân
6
Các tính chất của tập dưới vi phân
6
Hàm piecewise linear
7
Hàm piecewise linear
7
Dưới vi phân của hàm piecewise linear
8
Ví dụ
9
Ví dụ
9
Ví dụ
9
¬ Ta có
{1} nếu x̄ < 0
{1, 2} nếu x̄ = 0
I (x̄) = {2} nếu 0 < x̄ < 2
{2, 3} nếu x̄ = 2
{3} nếu x̄ > 2
10
{−1} nếu x < 0
1
[−1, ] nếu x = 0
2
1
∂f (x) = { } nếu 0 < x < 2
2
1
[ , 1] nếu x = 2
2
{1} nếu x > 2
11
Biển diễn dưới vi phân thông qua nón pháp tuyến
12
Bài toán tối ưu lồi không ràng buộc
Định lý
Cho f : Rn → R̄ là hàm lồi chính thường. Một điểm x̄ là nghiệm
tối ưu toàn cục bài toán minn f (x) khi và chỉ khi a
x∈R
0 ∈ ∂f (x̄).
a
Theorem 3.5, Subsection 3.2, M.S. Bazaraa, H.D. Sherali, C.M. Shetty
(2006), Nonlinear Programming: Theory and Algorithms, Wiley.
13
Example
f (x) = |x|
0 ∈ ∂f (x) ⇐⇒ x = 0.
14
Thuật toán subgradient
¬ Dãy lặp
x k+l := x k − τk γk g k (3)
15
Thuật toán subgradient
¬ Dãy lặp
x k+l := x k − τk γk g k (3)
15
Scaling coefficient
Có thể chọn
1
γk = , k = 1, 2, . . .
max{c, ∥g k ∥}
với c > 0.
16
Lựa chọn scaling coefficient
Có thể chọn
1
γk =
∥g k ∥
hoặc
1
γk =
max{c, ∥g k ∥2 }
17
Sự hội tụ của thuật toán subgradient
x k+l := x k − τk γk g k
Định lý
Giả sử rằng bài toán (P) có nghiệm tối ưu. Dãy lặp {xk } sử dụng
∞
X
step sizes τk > 0 thỏa mãn điều kiện τk = ∞ và
k=1
∞
X
τk2 < ∞
k=1
a
hội tụ về nghiệm của bài toán minn f (x).
x∈R
a
Theorem 7.4, M.S. Bazaraa, H.D. Sherali, C.M. Shetty (2006), Nonlinear
Programming: Theory and Algorithms, Wiley. 18
Ví dụ
▶ x0 = 2
1
▶ Step size αk =
k +1
19
Tiêu chuẩn dừng
20
Tiêu chuẩn dừng
Hoặc
20
Tiêu chuẩn dừng
Hoặc
• ∥xk+1 − xk ∥ < ϵ
20
2
Bài toán tối ưu lồi có ràng buộc
2
Subsection 8.9, M.S. Bazaraa, H.D. Sherali, C.M. Shetty (2006), Nonlinear
Programming: Theory and Algorithms, Wiley.
21
x k+l := PΩ (x k − τk γk g k ), k = 1, 2, . . .
3
PΩ (x) = argmin{∥x − v ∥ : v ∈ Ω}
22
x k+l := PΩ (x k − τk γk g k ), k = 1, 2, . . .
3
PΩ (x) = argmin{∥x − v ∥ : v ∈ Ω}
22
Chú ý 1
23
Chú ý 2
Bài toán
min{∥x − v ∥ : v ∈ Ω} (4)
4
cũng là bài toán tối ưu lồi.
4
Hàm khoảng cách tới một tập hợp lồi đóng khác rỗng là lồi (BTVN)
24
Ví dụ
¬ Giải bao hàm thức 0 ∈ ∂f (x), ta được tập nghiệm của (P) là
đoạn [−1, 1].
25
Ví dụ
¬ Giải bao hàm thức 0 ∈ ∂f (x), ta được tập nghiệm của (P) là
đoạn [−1, 1].
Dùng phương pháp subgradient chiếu, giải xấp xỉ một nghiệm bài
toán (P), lập trình bằng Python.
25
Thực hành
Thực hành phương pháp extragradient giải xấp xỉ nghiệm của bài
toán minimax là điểm cân bằng của trò chơi ma trận hai người
tổng bằng không 5
5
D.T.K. Huyen, J.-C. Yao, Affine minimax variational inequalities and matrix
two-person games, Journal of Fixed Point Theory and Applications 23 (2021),
No. 2, Paper 22. DOI: 10.1007/s11784-021-00851-7.
26