Professional Documents
Culture Documents
9 1-Oanh
9 1-Oanh
9 1-Oanh
được gọi là các phương trình chuẩn của vấn đề bình phương nhỏ nhất.
Trung tâm phân tích của các bất đẳng thức tuyến tính
Chúng ta xem xét vấn đề tối ưu hóa:
Hàm mục tiêu f trong vấn đề này được gọi là rào cản logarit cho các bất đẳng thức
. Nếu giải pháp của (9.5) tồn tại, nó được gọi là trung tâm phân tích của các
bất đẳng thức. Điểm khởi đầu x(0) phải thoả mãn các bất đẳng thức nghiêm ngặt
. Do f là hàm đóng, tập con cấp S cho bất kỳ điểm như vậy đều
đóng.
Trung Tâm Phân Tích của Bất Đẳng Thức Ma Trận Tuyến Tính
Hàm mục tiêu f được gọi là hàng rào logarit cho bất đẳng thức ma trận tuyến tính
và giải pháp (nếu tồn tại) được gọi là trung tâm phân tích của bất đẳng thức
ma trận tuyến tính. Điểm khởi tạo phải thoả mãn bất đẳng thức ma trận tuyến
tính nghiêm ngặt . Giống như ví dụ trước, tập hợp sublevel của bất kỳ
điểm nào như vậy sẽ kín do kín.
9.1.2 Tính Lồi Mạnh và Hậu Quả của Nó
Trong phần lớn chương này (ngoại trừ §9.6), chúng ta giả định rằng hàm mục tiêu là
lồi mạnh trên S, có nghĩa là tồn tại một m > 0 sao cho:
(9.7)
với tất cả x ∈ S. Tính lồi mạnh có nhiều hậu quả thú vị. Với x, y ∈ S, chúng ta có:
với một số z trên đoạn thẳng [x, y]. Theo giả định lồi mạnh (9.7), số hạng cuối cùng ở
(9.8)
Khi m = 0, chúng ta thu được bất đẳng thức cơ bản đặc trưng cho tính lồi; với m > 0,
chúng ta có được giới hạn dưới tốt hơn cho so với chỉ từ tính lồi.
Đẳng thức (9.8) có thể được sử dụng để giới hạn f(x) - p*, là sự không tối ưu của
điểm x, thông qua . Phía bên phải của (9.8) là một hàm lồi bậc hai của y
(với x cố định). Khi đặt gradient đối với y bằng không, chúng ta thấy rằng
làm cho phía bên phải đạt giá trị nhỏ nhất. Do đó, chúng ta có:
(9.9)
Bất đẳng thức này cho thấy nếu gradient nhỏ tại một điểm thì điểm đó gần như là tối
ưu. Bất đẳng thức (9.9) cũng có thể được diễn giải là một điều kiện cho sự không tối
ưu, tổng quát hóa điều kiện tối ưu (9.2):
(9.10)
Chúng ta cũng có thể suy ra một giới hạn cho , khoảng cách giữa x và bất kỳ
điểm tối ưu nào, thông qua ∇f(x)²:
(9.11)
Để thấy điều này, chúng ta áp dụng (9.8) với y = x để thu được
trong đó chúng ta sử dụng bất đẳng thức Cauchy-Schwarz trong bất đẳng thức thứ hai.
Vì nên ta phải có
từ đó (9.11) suy ra. Một hệ quả của (9.11) là điểm tối ưu là duy nhất.
(9.13)
Điều này tương tự với (9.8). Việc tối thiểu hóa mỗi bên theo y cung cấp:
(9.14)
đó là đối tác của (9.9).
Điểm khởi tạo và tập sublevel
Từ bất đẳng thức lồi mạnh (9.7) và bất đẳng thức (9.12) chúng ta có:
(9.15)
với tất cả x ∈ S. Tỉ lệ κ = M/m là giới hạn trên của số điều kiện của ma trận ,
tức là tỉ lệ của giá trị riêng lớn nhất so với giá trị riêng nhỏ nhất. Chúng ta cũng có thể
đưa ra một giải thích hình học của (9.15) liên quan đến các tập sublevel của .
Chúng ta định nghĩa chiều rộng của một tập hợp lồi C ⊆ theo hướng q, với q² = 1,
là:
Chiều rộng nhỏ nhất và chiều rộng lớn nhất của C được cho bởi:
Số điều kiện của tập hợp lồi C được định nghĩa là:
nơi κ(A) biểu thị số điều kiện của ma trận A, tức là tỷ lệ giữa giá trị riêng lớn nhất và
nhỏ nhất của nó. Như vậy, số điều kiện của ellipsoid E giống với số điều kiện của ma
trận A định nghĩa nó.
Bây giờ giả sử hàm thỏa mãn Chúng ta sẽ
đưa ra một giới hạn trên cho số điều kiện của tập α-sublevel Cα={x∣f(x)≤α} với
. Áp dụng (9.13) và (9.8) với x = x*, chúng ta có:
Điều này ngụ ý rằng Binner⊆Cα⊆Bouter nơi:
Nói cách khác, tập α-sublevel chứa Binner và nằm trong Bouter, đó là các quả cầu với
bán kính:
tương ứng. Tỉ lệ của bình phương các bán kính cung cấp một giới hạn trên cho số điều
kiện của Cα:
Chúng ta cũng có thể đưa ra một giải thích hình học cho số điều kiện của
Hessian tại điểm tối ưu. Từ chuỗi Taylor của xung quanh x* chúng ta thấy rằng cho
α gần với p*,
được xấp xỉ tốt bởi một ellipsoid với tâm là x*. Do đó:
Chúng ta sẽ thấy rằng số điều kiện của các tập sublevel của (được giới hạn bởi
M/m) có ảnh hưởng mạnh mẽ đến hiệu quả của một số phương pháp thông dụng trong
tối ưu hóa không ràng buộc.