Professional Documents
Culture Documents
mhh - lập trình ngẫu nhiên và ứng dụng
mhh - lập trình ngẫu nhiên và ứng dụng
trong đó các tham số ω1, ω2 là các biến đồng nhất (ngẫu nhiên) theo phân phối
Uniform(a, b), chinh xác là ω1 ∼ Uniform(1, 4), ω2 ∼ Uniform(1/3, 1).
• Khi cả hai ω1 = ω2 = 1 thì hai điều kiện trở thành
x1 + x2 = 4 tạo đường màu đỏ và x1 + x2 = 7 tạo đường chấm màu xanh,
rõ ràng là bạn có được vùng khả thi chứa đầy đủ mũi tên màu xanh lá cây (Hình 1).
• Làm thế nào để giải quyết vấn đề này nếu ω1, ω2 thực sự là các biến đồng nhất (ngẫu nhiên)?
Chúng ta có ý gì khi giải quyết vấn đề này?
1. Cách tiếp cận chờ xem: Giả sử có thể quyết định về các biến quyết định
x = [x1, x2] sau khi quan sát vectơ ngẫu nhiên ω = [ω1, ω2]?
[đại diện một phần vì dữ liệu không chắc chắn của vấn đề.] Chúng ta có thể giải quyết vấn đề mà
không cần chờ đợi không?
2. Có, chúng ta có thể giải quyết vấn đề nhưng không phải chờ đợi, tức là chúng ta cần quyết định
x = [x1, x2] trước biết các giá trị của ω = [ω1, ω2]? Chúng ta cần quyết định phải làm gì khi không biết
ω.
1 or also replace T x ≤ h by with P[T x ≤ h] ≤ 1 − p
Chúng tôi đề xuất (a) Đoán sự không chắc chắn và (b) Các ràng buộc về xác suất (xem Định nghĩa 1).
(a) Đoán sự không chắc chắn Chúng ta sẽ đoán một vài giá trị hợp lý cho ω. Ba (hợp lý)
gợi ý – mỗi gợi ý cho chúng ta biết điều gì đó về mức độ ‘rủi ro’ của chúng ta
♦ Không thiên vị: Chọn giá trị trung bình cho từng tham số ngẫu nhiên ω
♦ Bi quan: Chọn giá trị trường hợp xấu nhất cho ω
♦ Lạc quan: Chọn các giá trị trường hợp tốt nhất cho ω.
Ví dụ: sử dụng phương pháp Không thiên vị, xem VÍ DỤ 1, phân bố đều Đồng nhất (a, b)
rõ ràng có trung bình Chương trình của chúng ta bây giờ trở thành
2 Lập trình tuyến tính ngẫu nhiên một giai đoạn - Không truy đòi (1-SLP)
Định nghĩa 2 (SLP với một giai đoạn (Không truy đòi): 1-SLP). Hãy xem xét chương trình sau
LP(α) được tham số hóa bởi vectơ ngẫu nhiên α:
2. Giá trị (T, h) không xác định: chúng không xác định trước khi một phiên bản của mô hình xuất hiện,
h(α) phụ thuộc chỉ trên αj ngẫu nhiên;
3. Độ không đảm bảo đo được biểu thị bằng phân bố xác suất của tham số ngẫu nhiên (αj ) = α vậy
LP xác định là trường hợp suy biến của Stochastic LP khi αj không đổi,
• Chúng ta giải các bài toán quyết định trong đó vectơ x = (x1, x2, · · · , xn) ∈ X quyết định
các biến phải được thực hiện trước khi biết vectơ tham số α ∈ Ω.
• Thông thường chúng ta đặt giới hạn dưới và giới hạn trên cho x thông qua miền xác định
X = {x ∈ Rn: l x u}.
PHƯƠNG PHÁP TIẾP CẬN: Trong Lập trình ngẫu nhiên, chúng tôi sử dụng một số giả định và sự
kiện.
Giả định cơ bản- Chúng tôi biết phân bố xác suất (chung) của dữ liệu. Do đó việc đầu tiên cách tiếp
cận này mang lại LP ràng buộc xác suất (Cơ hội)
Phân tích Kịch bản - không hoàn hảo nhưng hữu ích, là cách tiếp cận thứ hai. Cách tiếp cận theo kịch
bản giả định rằng tự nhiên có thể đưa ra một số lượng hữu hạn các quyết định (kết quả của tính ngẫu
nhiên). Mỗi quyết định có thể xảy ra này được gọi là một kịch bản
2.1 TIẾP CẬN 1 : sử dụng Ràng buộc cơ hội và Rủi ro chấp nhận được
Tx h
• Có thể thay bằng ràng buộc xác suất
đối với một số mức độ tin cậy quy định p ∈ (.5, 1), (được xác định bởi chủ sở hữu vấn đề.)
LP trong Định nghĩa (2) ở trên với tham số ngẫu nhiên α = [α1, α2, · · · ] thì được gọi là
Ràng buộc xác suất LP, hoặc chỉ 1-SLP.
• Rủi ro sẽ được xử lý một cách rõ ràng nếu xác định được một
Ràng buộc cơ hội Tx h giả sử rằng rủi ro chấp nhận được rx nhỏ hơn mức tối đa được
chỉ định 1 p ∈ (0, 1).
Định nghĩa 3. LP ngẫu nhiên hoặc 1-SLP có ràng buộc xác suất được xác định bởi
một hệ số ngẫu nhiên α = (α1, α2, . . ., αn) trong các ràng buộc cơ hội, và mục tiêu tuyến tính f(x):
LƯU Ý: chúng tôi sử dụng vectơ tham số α = [α1, α2, · · · ] nói chung và
biểu thị ω = [ω1, ω2, · · · , ωS] cụ thể cho các trạng thái được gọi là kịch bản. Chúng tôi xử lý từng tình
huống ω ∈ ω có thể do sự kết hợp của nhiều tham số ngẫu nhiên αi cùng một lúc trong một SP.
2.2 PHƯƠNG PHÁP 2: đối với ràng buộc ngẫu nhiên T() x h()
Sử dụng phân tích kịch bản của T() x h()
Loại chương trình này hướng tới một mục tiêu tuyến tính cụ thể trong khi tính toán xác suất
chức năng liên quan đến các kịch bản khác nhau. Do đó, chúng tôi tìm ra giải pháp tổng thể bằng cách
Ưu điểm: Mỗi bài toán trong kịch bản là một LP. / vs / Nhược điểm
: phân b ri rc mô hình LP s nguyên hn hp. (Nói chun
-------------------------------------------------------------------------------------------------------------------------■
(2)
trong đó x = (x1, x2, · · · , xn) là các biến quyết định giai đoạn đầu,
f(x) có thể tuyến tính hoặc không, là một phần của hàm mục tiêu lớn g(x).
do ảnh hưởng của kịch bản. ω. Q(x) là giá trị tối ưu của một vấn đề giai đoạn hai nhất định
(3)
Các vectơ α = α(ω) và y = y(ω) được đặt tên là các biến quyết định hiệu chỉnh, điều chỉnh hoặc truy
đòi, chỉ được biết đến sau thí nghiệm e.
Tóm lại, chúng ta tối thiểu hóa tổng chi phí dự kiến g(x) = f(x) + Q(x) trong khi vẫn thỏa mãn
Ở đây W được gọi là ma trận truy đòi m × p và chúng ta bắt đầu với trường hợp đơn giản là m = 1,
q là vectơ chi phí truy đòi đơn vị, có cùng thứ nguyên với y và y = y(ω) ∈ RP. ■
Hình 2: Chế độ xem tiêu chuẩn của chương trình ngẫu nhiên hai giai đoạn
Được phép của Maarten van der Vlerk, Đại học. của Groningen, NL
4 Lập trình tuyến tính ngẫu nhiên hai giai đoạn (2-SLP)
Bây giờ chúng ta xử lý two-stage LP ngẫu nhiên bằng hành động truy đòi.
4.1 Mô hình truy đòi SLP two-stage - (dạng đơn giản)
Định nghĩa 5 (LP ngẫu nhiên two-stage có truy đòi: 2-SLPWR). two-stage Stochastic
chương trình tuyến tính Có truy đòi (2-SLPWR) hoặc chính xác là có hành động khắc phục trừng phạt
nói chung được mô tả như
được đặt tên là biến hành động truy đòi đối với quyết định x và việc thực hiện ω.
Các hành động truy đòi được xem là Xử phạt các hành động khắc phục trong SLP.
Việc sửa lỗi phạt được thể hiện thông qua giá trị ý nghĩa LÀM THẾ NÀO
ĐỂ TÌM NÓ?
Các phương pháp tiếp cận chính- PHƯƠNG PHÁP 2: Phân tích lại các kịch bản
Để giải hệ (4-4.1) bằng số, các phương pháp dựa trên vectơ ngẫu nhiên α có hữu hạn
số khả năng thực hiện được gọi là kịch bản.
Giá trị kỳ vọng Q(x) hiển nhiên đối với phân bố rời rạc của ω!
Vì vậy, chúng ta lấy Ω = {ωk} là một tập hữu hạn có kích thước S (có một số hữu hạn các kịch bản
Trong đó
• - chi phí phạt khi sử dụng đơn vị yk trong giai đoạn hiệu chỉnh,
phụ thuộc vào cả quyết định x ở giai đoạn đầu và kịch bản ngẫu nhiên
4.2 Mô hình truy đòi SLP hai giai đoạn - (dạng chính tắc)
Bây giờ chúng ta mô tả đầy đủ đặc tính của hệ thống (4-4.1) trong trường hợp tuyến tính.
Định nghĩa 6 (Chương trình tuyến tính ngẫu nhiên có hành động truy đòi (2-SLPWR) ). Kinh điển 2-
chương trình tuyến tính ngẫu nhiên giai đoạn với Recourse có thể được xây dựng dưới dạng
trong đó v(y) := v(x, ω) là hàm giá trị giai đoạn thứ hai và
là hành động truy đòi đối với quyết định x và hiện thực hóa ω.
1. Chi phí truy đòi dự kiến của quyết định x là Q(x) := Eω[v(x, ω)] theo phương trình (5). [trước
chi phí dự kiến chính xác của việc truy đòi y(α), đối với bất kỳ chính sách nào Do đó về
tổng thể chúng tôi giảm thiểu tổng chi phí dự kiến
● Chúng tôi thiết kế các biến quyết định thứ 2 y(ω) để chúng tôi có thể (điều chỉnh, sửa đổi hoặc)
phản ứng với các ràng buộc ban đầu (4.2) theo cách thông minh (hoặc tối ưu): chúng tôi gọi đó là
hành động truy đòi!
Một đơn vị sản phẩm i yêu cầu aij 0 đơn vị phần j , trong đó i = 1, . . . , n và j = 1, . . . , m. Các
Nhu cầu về sản phẩm được mô hình hóa dưới dạng vectơ ngẫu nhiên ω = D = (D1, D2, · · · , Dn).
Vấn đề ở giai đoạn thứ hai:
Đối với một giá trị quan sát được (một sự thực hiện) d = (d1, d2, · · · , dn) của vectơ nhu cầu ngẫu
nhiên ở trên D, chúng ta có thể tìm ra phương án sản xuất tốt nhất bằng cách giải chương trình tuyến tính
ngẫu nhiên (SLP) sau đây với các biến quyết định z = (z1, z2, · · · , zn) - số lượng đơn vị được sản
xuất, và các biến quyết định khác y = (y1, y2, · · · , ym) - số lượng linh kiện còn lại trong kho
trong đó sj < bj (được định nghĩa là chi phí đặt hàng trước trên mỗi đơn vị của phần j) và
xj , j = 1, . . . , m là số lượng chi tiết cần đặt hàng trước khi sản xuất.
Toàn bộ mô hình (của giai đoạn thứ hai) có thể được biểu diễn tương đương như sau
Nhận thấy rằng lời giải của bài toán này, tức là các vectơ z, y phụ thuộc vào việc thực hiện d của
cầu ngẫu nhiên ω = D cũng như quyết định bước 1 x = (x1, x2, · · · , xm).
b = (b1, b2, · · · , bm) được xây dựng theo chi phí đặt hàng trước bj trên một đơn vị của phần j
(trước khi biết nhu cầu). Các đại lượng xj được xác định từ bài toán tối ưu hóa sau
5 ỨNG DỤNG I: Chương trình tuyến tính ngẫu nhiên cho sơ tán
Lập kế hoạch ứng phó thiên tai (SLP-EPDR)
MỤC TIÊU - ĐỘNG LỰC
Chúng tôi muốn sử dụng mô hình SLP hai giai đoạn để sơ tán những người bị ảnh hưởng đến khu vực an
toàn trong thời gian ứng phó thiên tai. Nghiên cứu điển hình dựa trên nghiên cứu của Li Wang và Esra
Koca
Mục tiêu chính của ứng phó khẩn cấp là cung cấp nơi trú ẩn và hỗ trợ cho những người bị ảnh hưởng
cũng như sớm nhất có thể. Kế hoạch sơ tán tối ưu cho người dân bị ảnh hưởng là một trong những thành
phần chủ yếu trong ứng phó khẩn cấp sau thảm họa, và rất nhiều học giả đã biểu thị nỗ lực của họ trong
việc này vấn đề thú vị.
CÁC PHƯƠNG PHÁP TIẾP CẬN: Lập trình ngẫu nhiên có truy đòi (Dantzig,) rất nổi tiếng phương
pháp xử lý tính ngẫu nhiên của các yếu tố và phương pháp này là tìm ra những quyết định không thể
đoán trước được
điều đó phải được thực hiện trước khi biết cách thực hiện các biến ngẫu nhiên. Theo số lượng của các
giai đoạn, quy hoạch ngẫu nhiên với bài toán truy đòi thường được gọi là như lập trình ngẫu nhiên hai
giai đoạn/nhiều giai đoạn.
Hình 3: Minh họa về sự xuất hiện của các sự kiện động đất hoặc chiến tranh tàn phá
Chúng ta nên đánh giá kế hoạch sơ tán của giai đoạn đầu tiên với thời gian sơ tán tổng thể dự kiến của
lộ trình sơ tán thích ứng trong mỗi kịch bản và xác suất xảy ra của từng kịch bản s được giả sử là ps = µs ,
s = 1, 2, . . . , S
• Các đội có thể sử dụng mô hình (9) và các mô hình tương đương [ trong Tài liệu tham khảo. 1]- chúng
được gọi là mô hình lập kế hoạch sơ tán hai giai đoạn phụ thuộc vào thời gian và ngẫu nhiên.
• Đảm bảo rằng bạn giải thích đầy đủ các ràng buộc của hệ thống và hàm mục tiêu của các mô hình
Kịch bản s = 2 với mật độ , số lượng các bộ phận được đặt hàng trước khi sản xuất
m = 5, chúng tôi mô phỏng ngẫu nhiên vectơ dữ liệu b, l, q, s và Ma trận A có kích thước n × m.
Chúng tôi cũng giả sử rằng vectơ nhu cầu ngẫu nhiên trong đó mỗi ωi
với mật độ pi theo thùng phân phối
Yêu cầu: Xây dựng các mô hình số của phương trình 7 và 8 với dữ liệu mô phỏng.
Tìm giải pháp tối ưu theo độ mềm phù hợp (as GAMSPy)
2. Đến SLP-EPDR: Giải pháp thuật toán (6 điểm)
Một số thuật toán giải pháp được đưa ra trong Phần 4 của Ref. 1, và năm nay 20023 CSE - HCMUT
Học sinh chỉ có thể thử cách tiếp cận đầu tiên (thuật toán 1) dựa trên vấn đề dòng chi phí tối thiểu.
Tìm hiểu, thực hiện và xác minh tính hiệu quả của thuật toán được nghiên cứu hoặc giải quyết mô hình
lập kế hoạch sơ tán ngẫu nhiên hai giai đoạn trên một mạng lưới lưới nhỏ, với thử nghiệm
Cách tiếp cận thiết kế. Chính xác thì mô phỏng sẽ có tối đa 50 nút và 100 liên kết ([in Section 5.1 of Ref. 1 ]).
7 Bổ sung: Phần mềm để tối ưu hóa ngẫu nhiên
7.1 Ngôn ngữ mềm và lập trình để tối ưu hóa ngẫu nhiên
Một số ngôn ngữ lập trình nổi tiếng để mô hình và phân tích ngẫu nhiên là
1. Gams/Decis: GAMS là viết tắt của ngôn ngữ mô hình đại số nói chung và là một trong những
các ngôn ngữ mô hình hóa được sử dụng rộng rãi nhất. Decis là một hệ thống để giải quyết các chương
trình ngẫu nhiên quy mô lớn, tức là các chương trình bao gồm tham số (hệ số và các mặt bên phải)
không được biết đến một cách chắc chắn, nhưng là giả sử được biết đến bởi phân phối xác suất của họ.
Nó sử dụng phân tách uốn cong và kỹ thuật lấy mẫu Monte Carlo tiên tiến.
Decis bao gồm một loạt các chiến lược giải pháp, chẳng hạn như giải quyết vấn đề vũ trụ (tất cả các
scenarios), vấn đề giá trị dự kiến, Monte Carlo lấy mẫu trong phân tách Benders
Thuật toán. Xem https://www.gams.com/latest/docs/S-DECIS.html và https://www.gams.com/latest/docs/S-
DECIS.html
Trong đó
• x là vectơ tham số thiết kế,
• ξ biểu thị các giá trị của quá trình ngẫu nhiên {U(t) = ξ} được xác định trên một xác suất thích
hợp
không gian mô tả sự tương tác của lưu lượng truy cập với thiết bị và
• H là phân bố cố định của quá trình U(t)
• Hàm f(x, ξ) với hai đối số mô tả hoạt động của thiết bị (thiết bị) bắt nguồn từ sự tương tác của
một giá trị lưu lượng nhất định ξ và một giá trị nhất định của các tham số thiết kế x.
• EH[.] là giá trị kỳ vọng liên quan đến H.
KHÁI NIỆM: Phân phối cố định là gì?
Định nghĩa 7 (Tính dừng mạnh).
Về mặt toán học, quá trình dừng mạnh hoặc nghiêm ngặt có nghĩa là đối với mọi k ∈ N và các
điểm thời gian với mỗi thời điểm thực hiện z = (t1, . . . , tk), sự phân bố của các chuỗi
Yz = (Yt1, · · · , Ytk) và Yz +h = (Yt1+h, · · · , Ytk+h) giống nhau. Nghĩa là, liên kết cdf F(.)
của
quá trình Y thỏa mãn Fz = Fz +h, với bất kỳ độ trễ thời gian h ∈ R+, tức là
Tính dừng nghiêm ngặt là một giả định rất mạnh mẽ; chúng tôi thường sử dụng như sau.
Định nghĩa 8 (Tính dừng yếu).
Một tiến trình {Yi} = Y1, Y2, . . . là dừng yếu, dừng bậc hai, dừng hiệp phương sai,
hoặc chỉ đứng yên nếu hai khoảnh khắc đầu tiên (trung bình và hiệp phương sai) không thay đổi theo
thời gian, hoặc bất biến như là một hàm của thời gian, nghĩa là E[Yi] và Cov[Yi ,Yi+k] không phụ thuộc
vào chỉ số i. Về mặt toán học, {Yi} là một quá trình dừng yếu nếu
• E[Yi] = µ (hằng số) với mọi i; [được đặt tên là ổn định trung bình], và
• hiệp phương sai thỏa mãn [tính dừng hiệp phương sai]
Phương pháp điểm trong luôn đưPhương pháp điểm trong luôn được thực hiện khi miền khả thi khác rỗng là đúng
hay sai