Professional Documents
Culture Documents
Chương 4
Chương 4
CHƯƠNG 4
Cân bằng chiến lược
hỗn hợp
1
11/14/2021
Nếu NC1 chọn sấp với xs p thì kết quả (sấp, sấp) và (sấp ngửa) xảy ra
với xs ½(p)
Nếu NC1 chọn ngửa với xs (1-p) thì kết quả (ngửa, sấp) và (ngửa, ngửa)
xảy ra với xs ½(1-p)
1-2q>0=>q<1/2
2
11/14/2021
3
11/14/2021
1) Mỗi người chơi không có sự thiên vị giữa tham gia buổi hòa
nhạc mà mình ít ưa thích cùng với người chơi khác và sự
ngẫu nhiên trong đó xs một người chơi đi đến một buổi hòa
nhạc trong khi người chơi thứ hai đi đến buổi hòa nhạc khác
là ½ và xs đi cùng đến một buổi hòa nhạc mà người chơi đó
thích hơn là ½.
B Thích S
u1(S,S)=1/2 *u1(B,S)+1/2*u1(B,B)
Thích B 2,1 0,0
u1(B,S)=0, u1(B,B)=2 → u1(S,S)=1 S 0,0 1,2
4
11/14/2021
U1(B,S)=0,
B S
U1(B,B)=2
B 2,1/2 0,0
U1(S,S)=1/2
S 0,0 ½,2
5
11/14/2021
6
11/14/2021
Nếu NC1 chọn sấp với xs p thì kết quả (sấp, sấp) và (sấp ngửa) xảy ra
với xs ½(p)
Nếu NC1 chọn ngửa với xs (1-p) thì kết quả (ngửa, sấp) và (ngửa, ngửa)
xảy ra với xs ½(1-p)
Sấp Ngửa
Trò chơi đồng xu (q) (1-q)
Sấp (p) 1, -1 -1, 1
Ngửa (1-p) -1, 1 1, -1
Hàm ĐƯTN của mỗi NC đối với chiến lược hỗn hợp của
người chơi khác là chiến lược thuần đơn hoặc tập hợp các
chiến lược hỗn hợp:
+ Nếu chiến lược hỗn hợp của NC 2 gán xác suất nhỏ hơn
½ cho kết quả Sấp=>hàm ĐƯTN của NC1 là chiến lược
thuần Ngửa
+ Nếu chiến lược hỗn hợp của NC 2 chỉ định xác suất lớn
hơn ½ cho Sấp, thì hàm ĐƯTN của NC1 là chiến lược
thuần Sấp,
+ Nếu chiến lược hỗn hợp của người chơi 2 chỉ định xác
suất ½ cho Sấp, thì tất cả chiến lược hỗn hợp của người
chơi 1 là hàm đáp ứng tốt nhất).
7
11/14/2021
8
11/14/2021
9
11/14/2021
B (q) S (1-q)
B (p) 2,0 0,0
S (1-p) 0,0 1,2
E1(B) E1(S)
q=1 2 0
q=1/2 1 ½
q=0 0 1
10
11/14/2021
- q=1 thì
11
11/14/2021
12
11/14/2021
B (q) S (1-q)
B (p) 2, 1 0, 0
S (1-p) 0, 0 1, 2
2
0 neu p
3
2
B2 p q : 0 p 1 neu p
3
2
1 neu p
3
13
11/14/2021
Bài tập 111.2 Tìm các cân bằng Nash chiến lược
hỗn hơp bằng hàm đáp ứng tốt nhất
L (q) R (1-q)
T (p)
B (1-p)
Bài tập 111.2 Tìm các cân bằng Nash chiến lược
hỗn hơp bằng hàm đáp ứng tốt nhất
L (q) R (1-q)
14
11/14/2021
1) Điều gì xảy ra nếu công nghệ cải tiến làm chi phí giám sát giảm đi?
2) Điều gì xảy ra nếu việc chi phí sức lao động của công nhân lớn hơn $50?
15
11/14/2021
1) Điều gì xảy ra nếu công nghệ cải tiến làm chi phí giám sát giảm đi?
2) Điều gì xảy ra nếu việc chi phí sức lao động của công nhân lớn hơn $50?
16
11/14/2021
17
11/14/2021
18
11/14/2021
19
11/14/2021
20
11/14/2021
21
11/14/2021
ĐỊNH LÝ 122.1
(Sự tồn tại của cân bằng Nash chiến lược hỗn
hợp khi không có chiến lược bị thống trị yếu
trong trò chơi xác định)
22
11/14/2021
23
11/14/2021
24
11/14/2021
25
11/14/2021
L R
T
B
Ví dụ 139.2
Tìm tất cả các cân bằng chiến lược hỗn hợp của trò chơi
biến thể của trò chơi BoS
26
11/14/2021
Ví dụ 139.2 B S X
B 4, 2 0, 0 0, 1
S 0, 0 2, 4 1, 3
NC1: (B), (S), (B,S)
NC2: (B), (S), (X), (B,S), (B,X), (S,X), (B,S,X)
- Xét NC1 chọn chiến lược thuần B thì hàm thưởng phạt của người chơi 2 khi gán xác
suất dương đối với 2 hoặc nhiều hơn hành động của mình (2,0,1) là khác nhau, vì thế
điều kiện đầu tiên trong Định lý 116.2 không thỏa.
Ví dụ xét ((B),(B,S)) thì 2 = 0 > 1 (không thỏa)
- Tương tự loại bỏ các trường hợp NC1 chọn thuần S và trường hợp ngược lại, NC2
chọn lần lượt các chiến lược thuần B,S,X và NC1 chọn chiến lược gán xác suất dương
đối với cả 2 hành động.
- Xét ((B,S),(B,S))
NC2: 2p = 4(1-p) > 1p + 3(1-p): Không thỏa → Loại
- Xét ((B,S), (B,X)
NC2: 2p = 1p + 3(1-p) > 4(1-p) → p = ¾ và thỏa bất phương trình (3/2>1)
NC1: 4q = 1(1-q) → q = 1/5 → CB Nash ((3/4,1/4)(1/5,0,4/5))
Ví dụ 139.2 B S X
B 4, 2 0, 0 0, 1
S 0, 0 2, 4 1, 3
NC1: (B), (S), (B,S)
NC2: (B), (S), (X), (B,S), (B,X), (S,X), (B,S,X)
- Xét ((B,S),(S,X))
NC1: Hành động B bị thống trị chặt chẽ bởi hành động S → Không là CB Nash
- Xét ((B,S), (B,S,X))
NC2: 2p = 4(1-p) = 1p + 3(1-p) → vô nghiệm
27