Professional Documents
Culture Documents
4. ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ - ΜΕΡΟΣ Γ
4. ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ - ΜΕΡΟΣ Γ
1
ΜΙΚΤΕΣ ΣΤΡΑΤΗΓΙΚΕΣ
o Η μέχρι τώρα ανάλυση βασίστηκε στην υπόθεση ότι οι παίκτες επιλέγουν τις όποιες
στρατηγικές τους κατά ντετερμινιστικό τρόπο. Υπό αυτή την έννοια, το σύνολο των
στρατηγικών ενός παίκτη 𝑖 ονομάζεται σύνολο καθαρών (ή αμιγών) στρατηγικών.
o Στην παρούσα ενότητα επεκτείνουμε την έννοια της στρατηγικής επιτρέποντας στους
παίκτες να επιλέγουν στρατηγικές με τυχαίο ή πιθανοτικό τρόπο. Με βάση αυτή την
προσέγγιση, μια μικτή στρατηγική ενός παίκτη 𝑖 είναι μια κατανομή πιθανότητας που
ορίζεται στο σύνολο των καθαρών στρατηγικών.
π.χ. έστω ότι ο παίκτης 1 έχει διαθέτει δυο καθαρές στρατηγικές, Α και Β. Μια μικτή
στρατηγική του παίκτη 1 είναι ένα διάνυσμα [𝑥, 1 − 𝑥], όπου 𝑥 είναι η πιθανότητα
επιλογής της καθαρής στρατηγικής Α και 1 − 𝑥 είναι η πιθανότητα επιλογής της
καθαρής στρατηγικής Β.
2
o Ας ξαναθυμηθούμε το παίγνιο κορώνα-γράμματα.
o Οι καθαρές στρατηγικές κάθε ατόμου είναι γράμματα (Γ) και κορώνα (Κ)
1/2 Κ Γ
Κ -1, 1 1, -1
Γ 1, -1 -1, 1
3
ΙΣΟΡΡΟΠΙΑ NASH ΣΕ ΜΙΚΤΕΣ ΣΤΡΑΤΗΓΙΚΕΣ (ΙΝΜΣ)
o Μέχρι στιγμής έχουμε δει τον τρόπο να βρίσκουμε ισορροπία/ες Nash μόνο για την
περίπτωση καθαρών στρατηγικών. Τώρα θα δούμε πως βρίσκουμε ισορροπία Nash
σε μικτές στρατηγικές.
𝑝 1−𝑝
1/2 Κ Γ
𝑟 Κ −1, 1 1, −1
1−𝑟 Γ 1, −1 −1, 1
5
o Συνεχίζουμε με τις αναμενόμενες αποδόσεις του παίκτη 2
6
o Ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ):
1/2 1/2
1/2 Κ Γ
1/2 Κ −1, 1 1, −1
1/2 Γ 1, −1 −1, 1
o Το κάθε ένα από τα τέσσερα αποτελέσματα του παιγνίου, {𝜥, 𝜥}, {𝜥, 𝜞}, {𝜞, 𝜥}, {𝜞, 𝜞},
λαμβάνει χώρα με πιθανότητα
1 1 1
∗ = = 𝟐𝟓%
2 2 4
7
o Η αναμενόμενη συνολική απόδοση του παίκτη 1 είναι
1 1 1 1
𝑉1 = ∗ (−1) + ∗ 1 + ∗ 1 + ∗ (−1) = 𝟎
4 4 4 4
1 1 1 1
𝑉2 = ∗ 1 + ∗ (−1) + ∗ (−1) + ∗ 1 = 𝟎
4 4 4 4
1/2 Γ Δ
Α 0, 0 0, −1
Β 1, 0 −1, 3
Παίγνιο 4.1
8
o Το παίγνιο αυτό δεν έχει ισορροπία Nash σε καθαρές στρατηγικές…
1/2 Γ Δ
Α 0, 0 0, -1
Β 1, 0 -1, 3
𝑝 1−𝑝
1/2 Γ Δ
𝑟 Α 0, 0 0, −1
1−𝑟 Β 1, 0 −1, 3
9
o Ξεκινάμε με τις αναμενόμενες αποδόσεις του παίκτη 1
𝑬𝑼𝟏 (𝜜) = 0 ∗ 𝑝 + 0 ∗ (1 − 𝑝) = 𝟎
10
o Συνεχίζουμε με τις αναμενόμενες αποδόσεις του παίκτη 2
𝑬𝑼𝟐 (𝜞) = 0 ∗ 𝑟 + 0 ∗ (1 − 𝑟) = 𝟎
11
o Ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ):
1/2 1/2
1/2 Γ Δ
3/4 Α 0, 0 0, −1
1/4 Β 1, 0 −1, 3
3 3 1 1
𝑉1 = ∗ 0 + ∗ 0 + ∗ 1 + ∗ (−1) = 𝟎
8 8 8 8
3 3 1 1
𝑉2 = ∗ 0 + ∗ (−1) + ∗ 0 + ∗ 3 = 𝟎
8 8 8 8
13
ΘΕΩΡΗΜΑ NASH
ΝΑΙ ΑΛΛΑ…
14
Αφού ο κάθε παίκτης είναι αδιάφορος μεταξύ
μιας στρατηγικής ισορροπίας και μιας στρατηγικής
μη-ισορροπίας, γιατί να επιλέξει την στρατηγική ισορροπίας?
Ναι αλλά… ο παίκτης 2 είναι αδιάφορος μεταξύ του να επιλέξει Κ ή Γ, όταν ο παίκτης
1 παίζει την μικτή στρατηγική [𝑟, 1 − 𝑟] = [1⁄2 , 1⁄2]. Εφόσον είναι αδιάφορος, γιατί
να παίζει Κ και Γ με πιθανότητες [𝑝, 1 − 𝑝] = [1⁄2 , 1⁄2] (στρατηγική ισορροπίας) και
όχι την καθαρή στρατηγική Κ ή Γ με βεβαιότητα (στρατηγική μη-ισορροπίας)?
15
ΟΡΟΛΟΓΙΑ
ΒΙΒΛΙΟΓΡΑΦΙΑ