Professional Documents
Culture Documents
Tìm hiểu về LTTC
Tìm hiểu về LTTC
Khái niệm: là khuôn khổ chung để hỗ trợ việc ra quyết định khi tiền thưởng ( thù
lao) bị phụ thuộc vào các hành động của những người chơi khác.
Thành phần: người chơi, chiến lược, phần thưởng, luật chơi
Nguồn gốc:
- Năm 1713, xuất hiện lần đầu tiên trong lá thư được viết bởi James Waldegrave.
- Năm 1944, tác phẩm LTTC và hành vi kinh tế đã làm nên bước đột phá lớn trong
LTTC hiện đại, khẳng định LTTC như một phân nhánh riêng biệt của toán học đưa
ra lời giải tối ưu cho những trò chơi tổng bằng 0 với 2 người chơi.
- Năm 1950, thảo luận đầu tiên của Prisoner’s dilemma xuất hiện
Giả định:
- Giả định 1: mỗi cá nhân hay các nhóm cá nhân là một người tham gia trong một
cuộc chơi và mục tiêu của họ là làm thế nào để giành lợi ích.
- Giả định 2: mỗi hành động của con người được dẫn dắt dựa trên nguyên tắc lý tính
theo ý nghĩa là trước mỗi quyết định, cá nhân đều cố gắng tính toán xem lợi
ích/thiệt hại của bản thân mình khi đưa ra quyết định đó như thế nào.
- Trò chơi bất đối xứng: có sự không cân bằng về thông tin hoặc quyền lợi giữa
2 bên. Một bên có thể có lợi thế về thông tin, kinh nghiệm, tài nguyên hoặc
chiến lược hơn so với bên còn lại.
VD: trò chơi tối hậu thư
2.2. Trò chơi tổng bằng 0 và tổng khác 0
- Trò chơi tổng bằng 0: tổng điểm của tất cả các người chơi luôn bằng 0. Nếu
một người chơi đạt được điểm số dương thì người chơi còn lại sẽ phải chịu
điểm số âm tương đương để tổng kết quả cuối cùng là 0. Nói dễ hiểu là người
chơi này hưởng lợi trên thiệt hại của người chơi khác.
VD: trò Poker, cờ vua hay cờ tướng…
- Trò chơi tổng khác 0: tổng điểm số của các người chơi có thể khác nhau và
không nhất thiết phải bằng 0. Lợi nhuận của một người chơi không tương ứng
với thua lỗ của người khác.
2.3. Trò chơi di chuyển đồng thời và tuần tự
- Trò chơi di chuyển đồng thời: mỗi người chơi đưa ra quyết định mà không
biết về quyết định của những người khác.
VD: đá bóng, kéo-búa-bao
- Trò chơi di chuyển tuần tự: một người chơi thực hiện di chuyển sau khi quan
sát bước di chuyển của người chơi khác. Người chơi xen kẽ các nước đi.
VD: cờ caro, cờ vua
Trong bối cảnh trò chơi độc quyền, nếu hai công ty phải định giá mà
không biết về quyết định của nhau thì đó là trò chơi di chuyển đồng thời.
Còn nếu một công ty đặt giá sau khi quan sát giá của đối thử thì đó là trò
chơi di chuyển tuần tự.
- Trò chơi one-shot: trò chơi cơ bản chỉ được chơi 1 lần và phải chọn thời điểm,
chiến lược phù hợp để sử dụng cơ hội đó.
VD: chơi bắn súng, mỗi viên đạn hoặc cú bắn đầu tiên có thể quyết định thắng
bại của người chơi.
- Trò chơi lặp đi lặp lại: trò chơi người chơi có thể thực hiện hành động nhiều
lần và có cơ hội học hỏi từ mỗi lần thử nghiệm.
VD: trò chơi giải đố
2.5. Trò chơi hợp tác và trò chơi bất hợp tác
- Trò chơi hợp tác: người chơi làm việc cùng nhau hướng tới một mục tiêu
chung. Không có người chiến thắng hoặc kẻ thua cuộc cá nhân; thay vào đó,
mọi người hợp tác để đạt được mục tiêu chung. Các trò chơi hợp tác phát triển
kỹ năng giao tiếp, giải quyết xung đột, hợp tác và đồng cảm
- Trò chơi bất hợp tác: Trong trò chơi bất hợp tác, người chơi không hợp tác
với nhau và thường tìm cách đạt được lợi ích cá nhân. Mục tiêu của mỗi người
chơi có thể xung đột với mục tiêu của người khác. Các trò chơi bất hợp tác
thường thách thức kỹ năng cạnh tranh và tư duy chiến lược.
Công ty B
Chiến lược Trái Phải
Công ty A
Lên 10, 20 15, 8
Xuống -10, 7 10, 10
Chiến lược áp đảo (dominant strategy): một chiến lược mang lại phần
thưởng cao nhất cho người chơi bất kể hành động của đối thủ là gì.
Chiến lược an toàn (secure strategy): một chiến lược đảm bảo lợi nhuận cao
nhất trong kịch bản tồi tệ nhất có thể xảy ra.
Cân bằng Nash (Nash quilibrium): một điều kiện mô tả một tập hợp các
chiến lược trong đó không người chơi nào có thể cải thiện phần thưởng của
mình bằng cách đơn phương thay đổi chiến lược của chính mình, dựa trên
chiến lược của những người chơi khác.
VD: Trong bảng, chiến lược chiếm ưu thế cho công ty A là lên. Để thấy điều
này, lưu ý rằng nếu công ty B chọn trái, lựa chọn tốt nhất của người chơi A là
lên vì 10 đơn vị lợi nhuận tốt hơn 10 đơn vị anh ta sẽ kiếm được bằng cách
chọn xuống. Nếu B chọn phải, lựa chọn tốt nhất của A sẽ lên vì 15 đơn vị lợi
nhuận tốt hơn 10 đơn vị anh ta sẽ kiếm được bằng cách chọn xuống.
Bất kể chiến lược của công ty B là trái hay phải, sự lựa chọn tốt nhất của công
ty A là lên. Lên là một chiến lược thống trị cho công ty A.
Nguyên tắc: Nếu bạn có chiến lược áp đảo, hãy chơi nó.
Câu hỏi: Liệu công ty B có chiến lược áp đảo hay không?
Công ty B không có chiến lược áp đảo. Bởi nếu cty A chọn lên, lựa chọn tốt
nhất của B là trái, vì 20 lợi nhuận tốt hơn 8 nếu B chọn xuống. Nhưng nếu A
chọn xuống, lựa chọn tốt nhất của B sẽ là phải, vì 10 tốt hơn kết quả là 7 nếu B
chọn trái. Do đó, lựa chọn tốt nhất của B phụ thuộc vào những gì A làm.
Câu hỏi: Công ty B nên làm gì trong trường hợp không có chiến lược áp đảo?
Công ty B sẽ chơi một chiến lược an toàn để đảm bảo lợi nhuận cao nhất trong
trường hợp xấu nhất.
Câu hỏi: Chiến lược an toàn của cty B là gì?
Công ty B chọn phải. Bằng cách chọn bên trái, B có thể đảm bảo khoản thanh
toán chỉ là 7, nhưng bằng cách chọn phải, cô ấy có thể đảm bảo khoản thanh
toán là 8.
Chiến lược an toàn có hai thiếu sót:
- Đây là một chiến lược rất bảo thủ.
- Nó không tính đến các quyết định tối ưu của đối thủ của bạn, do đó có thể ngăn
bạn kiếm được khoản lợi nhuận cao hơn đáng kể.
VD: Cty B có thể suy luận rằng cty A chắc chắn sẽ chọn lên vì đó là chiến
lược áp đảo của họ => Cty B không nên chọn chiến lược an toàn (phải) mà
thay vào đó hãy chọn trái, cty B sẽ kiếm được 20 lợi nhuận hơn là 8 nếu
chọn phải.
Nguyên tắc: đặt mình vào vị trí của đối thủ, hãy nhìn trò chơi từ quan điểm
của đối thủ nếu họ có chiến lược áp đảo.
Câu hỏi: chiến lược cân bằng Nash cho cty A và B là gì?
Là chiến lược (lên, trái), mỗi cty đều đang làm tốt nhất có thể để đưa ra quyết
định của người chơi khác.
5.1. Cân bằng Nash là một tập hợp các chiến thuật được sử dụng bởi các người chơi mà
tại đó không một người chơi nào có thể hưởng lợi từ việc thay đổi chiến thuật hiện
tại của mình một cách đơn phương.
5.2. Điều kiện xảy ra cân bằng Nash:
Mọi người chơi sẽ cố gắng để tối đa hóa lợi ích được mô tả trong trò
chơi.
Người chơi không gặp khó khăn trong việc chọn chiến thuật
Người chơi có ý thức để đưa ra giải pháp
Mỗi người chơi sẽ biết được chiến thuật để đạt cân bằng của người
chơi khác
Mỗi sự thay đổi trong chiến thuật của người chơi này sẽ không dẫn tới
sự thay đổi chiến thuật của người chơi khác.
Mọi người chơi phải biết rằng bản thân và đối thủ đều thỏa mãn
những điều kiện này
5.3. Tính chất của cân bằng Nash:
Tính tư lợi cá nhân: Trong cân bằng Nash, chiến lược mà mỗi người chơi
chọn sẽ tối ưu hóa kết quả của người đó với giả sử rằng chiến lược của
mọi người chơi khác là cố định. Mọi người chơi được cho là sẽ hành
động dựa trên mục đích cá nhân và họ sẽ không cân nhắc tới lợi thế hoặc
chiến lược của người chơi khác nếu như chúng không ảnh hưởng tới kết
quả của chính họ.
Tính tối ưu hỗ tương: Trong cân bằng Nash, chiến lược của mỗi người
chơi là tối ưu nhất đối với chiến lược của mọi người chơi khác. Nói cách
khác, không có người chơi nào có thể thay đổi chiến lược một cách đơn
phương để có một kết quả tốt hơn.
Tính quyết định đồng thời: Cân bằng Nash xảy ra trong trò chơi khi
người chơi lựa chọn chiến lược của mình một cách đồng thời mà không
biết chiến lược của người chơi khác là gì. Do đó, cân bằng Nash chính là
kết quả có được khi không có người chơi nào có ý định thay đổi chiến
thuật của mình nữa.
Tính ổn định của đầu ra: Vì không có người chơi nào muốn thay đổi
chiến lược của mình trong cân bằng Nash nên kết quả của cân bằng Nash
luôn được giữ ở trạng thái ổn định. Tuy nhiên, không phải lúc nào cân
bằng Nash cũng cho ta một kết quả tối ưu nhất cho người chơi.
Tính độc lập nhị phân: Cân bằng Nash sẽ không bị ảnh hưởng bởi những
sự thay đổi chiến lược hoặc kết quả của những người chơi không tham
gia vào đầu ra của thế cân bằng.
Tính đa thế cân bằng: Một vài trò chơi sẽ có nhiều cân bằng Nash, tức là
sẽ có nhiều đầu ra ổn định. Trong những tình huống này, kết quả của trò
chơi sẽ dựa vào lựa chọn ban đầu của từng người chơi hoặc những tác
nhân bên ngoài để xác định trạng cân bằng Nash đang hướng tới.
Nhược điểm:
- Việc xác định giải pháp tối ưu trở nên khó khăn với sự gia tăng số lượng người
tham gia.
- Đó là một chiến lược hợp lý hơn và không phải là một chiến lược chiến thắng.
- Khái niệm này không giải thích được những bất ổn gặp phải trong các tình huống
kinh doanh thực tế.
- Lý thuyết mong đợi những người tham gia hành động theo lý trí, điều này không
phải lúc nào cũng đúng