Download as pdf or txt
Download as pdf or txt
You are on page 1of 21

Θεωρία

Παιγνίων και Αποφάσεων



Ενότητα 6:
Κοινωνικό όφελος και τίμημα της
αναρχίας

Ε. Μαρκάκης
Επικ. Καθηγητής
Επιλογή σημείων ισορροπίας
•  Έστω ότι έχουμε ένα παίγνιο με πολλά σημεία
ισορροπίας
•  Ποιο θα προτείναμε ως καλύτερο ή επικρατέστερο?
•  Δεν υπάρχει πάντα ξεκάθαρη απάντηση
•  Σε κάποιες περιπτώσεις παίζουν ρόλο και άλλα
χαρακτηριστικά του παιγνίου
–  Υπάρχει προτίμηση σε αμιγείς αντί για μεικτές
στρατηγικές?
–  Υπάρχουν στρατηγικές που είναι πιο εύκολα
υλοποιήσιμες από κάποιες άλλες?
2
Bach or Stravinsky (BoS)
B S
B 2, 1 0, 0

S 0, 0 1, 2

Έχουμε συνολικά 3 σημεία ισορροπίας:


•  (Β, Β)
•  (S, S)
•  ((2/3, 1/3), (1/3, 2/3))
Ποιο σημείο θα προτείναμε ως «καλύτερο»?
3
Bach or Stravinsky (BoS)
B S
B 2, 1 0, 0

S 0, 0 1, 2

Έχουμε συνολικά 3 σημεία ισορροπίας:


•  Το 1ο σημείο ευνοεί ξεκάθαρα τον π. 1
•  Το 2ο σημείο ευνοεί ξεκάθαρα τον π. 2
•  Το 3ο δεν ευνοεί κάποιον από τους 2, αλλά έχει θετική
πιθανότητα να συμβεί το (B, S) και το (S, B)
4
Περαιτέρω παραδείγματα
L R L R

T 1, 1 0, 0 T 2, 2 3, 0

0, 0
B 0, 0 0, 3
B 3, 3

•  Στο παίγνιο αριστερά:


–  2 σημεία ισορροπίας (T, L), (B, R)
–  Το 1ο φαίνεται προτιμότερο (έχει καλύτερες ωφέλειες)
–  το σημείο (B, R) περιέχει ασθενώς κυριαρχούμενες στρατηγικές
•  Στο παίγνιο δεξιά:
–  2 σημεία ισορροπίας (T, L), (B, R)
–  Το 2ο φαίνεται προτιμότερο, αναφορικά με τις ωφέλειες
–  όμως, και η B και η R είναι ασθενώς κυριαρχούμενες
5
Το κοινωνικό όφελος ως κριτήριο
επιλογής
•  Ορισμός: Δεδομένου ενός προφίλ στρατηγικών, το
παραγόμενο κοινωνικό όφελος είναι το άθροισμα
των ωφελειών των παικτών
–  Σε ένα προφίλ αμιγών στρατηγικών (si, tj)
SW(si, tj) = u1(si, tj) + u2(si, tj)
–  Σε ένα προφίλ μεικτών στρατηγικών (p, q), παίρνουμε το
μέσο κοινωνικό όφελος
SW(p, q) = u1(p, q) + u2(p, q)

6
Bach or Stravinsky (BoS)
B S
B 2, 1 0, 0

S 0, 0 1, 2
Έχουμε συνολικά 3 σημεία ισορροπίας:
•  (Β, Β)
- SW(B, B) = 3
•  (S, S)
- SW(S, S) = 3
•  (p, q) = ((2/3, 1/3), (1/3, 2/3))
- SW(p, q) = 2/3 x 1/3 x 3 + 1/3 x 2/3 x 3 = 12/9 = 4/3
7
Το κοινωνικό όφελος ως κριτήριο
επιλογής
•  Αν μπορούμε να υποδείξουμε στρατηγικές στους
παίκτες, μπορούμε να επιλέγουμε το σημείο ισορροπίας
με το μεγαλύτερο κοινωνικό όφελος
•  Αν υπάρχουν ισοβαθμίες, τότε οποιοδήποτε από τα
σημεία με το μεγαλύτερο όφελος είναι ικανοποιητικό
(π.χ. 2 επιλογές στο Bach-or-Stravinsky)
•  Μεγάλη συνολική ωφέλεια ⇒ καλύτερη αξιοποίηση της
έκβασης που προκύπτει
–  Π.χ. σε δημοπρασίες για αδειοδοτήσεις, οι παίκτες με μεγάλη
ωφέλεια πιθανότατα έχουν και τους πόρους για να
αξιοποιήσουν καλύτερα τις υποδομές

8
Το Τίμημα της Αναρχίας
(Price of Anarchy)

9
Κοινωνικό όφελος στα σημεία
ισορροπίας

•  Υπάρχουν αρκετά παραδείγματα παιγνίων με πολλά σημεία
ισορροπίας, τα οποία δεν παράγουν το ίδιο κοινωνικό
όφελος
•  Υπάρχουν επίσης παραδείγματα όπου κανένα από τα
σημεία ισορροπίας δεν παράγει το μεγαλύτερο δυνατό
κοινωνικό όφελος
–  Μπορεί να υπάρχει προφίλ που δεν είναι σημείο ισορροπίας και
έχει καλύτερο όφελος
•  Είναι απόρροια της στρατηγικής/εγωιστικής συμπεριφοράς
του κάθε παίκτη
–  Κανένας δεν νοιάζεται για το κοινωνικό καλό, καθένας ενδιαφέρεται
για τη δική του συνάρτηση ωφέλειας
10
Παράδειγμα 1: Prisoner’s Dilemma
C D
C 3, 3 0, 4

D 4, 0 1, 1

•  Το προφίλ (D, D) είναι το μοναδικό σημείο ισορροπίας του
παιγνίου
–  Θυμηθείτε ότι η στρατηγική D είναι κυρίαρχη και για τους 2 παίκτες
•  Βέλτιστο κοινωνικό όφελος: στο προφίλ (C, C)
Πόρισμα: Η εγωιστική συμπεριφορά εδώ έχει σαν αποτέλεσμα να
καταλήξουμε σε μια «κακή» έκβαση
11
Παράδειγμα 2
t1 t2 t3
s1 4, 3 3, 2 5, 1
s2 3, 2 24, 4 4, 2
s3 1, 8 2, 8 37, 5

•  2 σημεία ισορροπίας με αμιγείς στρατηγικές:


(s1, t1), (s2, t2)
•  SW(s1, t1) = 7, SW(s2, t2) = 28
•  Βέλτιστο κοινωνικό όφελος: 42 στο (s3, t3)
12
Το τίμημα της αναρχίας
[Koutsoupias, Papadimitriou ’99]
•  Τι επιπτώσεις έχει η στρατηγική συμπεριφορά στο
κοινωνικό καλό?
•  Μπορούμε να ποσοτικοποιήσουμε τη «ζημιά» που
προέρχεται από την εγωιστική συμπεριφορά?
•  Χειρότερο σενάριο: σημείο ισορροπίας με το χειρότερο
κοινωνικό όφελος
•  Μπορούμε να μετράμε πόσο απέχει το χειρότερο σημείο
ισορροπίας ενός παιγνίου από το βέλτιστο κοινωνικό
όφελος

13
Το τίμημα της αναρχίας
[Koutsoupias, Papadimitriou ’99]
•  Χειρότερο σενάριο: σημείο ισορροπίας με το χειρότερο
κοινωνικό όφελος
•  Το τίμημα της αναρχίας (price of anarchy) για αμιγείς
στρατηγικές:
PoA = maxs OPT/SW(s)

•  OPT = βέλτιστο κοινωνικό όφελος του παιγνίου
•  Η μεγιστοποίηση είναι ως προς όλα τα προφίλ s που είναι
σημεία ισορροπίας με αμιγείς στρατηγικές
•  Θεωρούμε παίγνια με μη αρνητικές ωφέλειες
-  Αν υπάρχουν αρνητικές ωφέλειες, μπορούμε να προσθέσουμε
μια μεγάλη σταθερά σε όλα τα κελιά χωρίς να επηρεαστεί το
παίγνιο
14
Το τίμημα της αναρχίας
[Koutsoupias, Papadimitriou ’99]
•  Ομοίως ορίζουμε το τίμημα της αναρχίας για μεικτές
στρατηγικές:

PoA = maxp OPT/SW(p)

•  OPT = βέλτιστο κοινωνικό όφελος του παιγνίου


-  Επιτυγχάνεται σε προφίλ αμιγών στρατηγικών
•  Η μεγιστοποίηση είναι ως προς όλα τα προφίλ p που είναι
σημεία ισορροπίας (είτε με αμιγείς είτε με μεικτές
στρατηγικές)

15
Παράδειγμα 2
t1 t2 t3
s1 4, 3 3, 2 5, 1
s2 3, 2 24, 4 4, 2
s3 1, 8 2, 8 37, 5
•  2 σημεία ισορροπίας με αμιγείς στρατηγικές: (s1, t1),
(s2, t2)
•  SW(s1, t1) = 7, SW(s2, t2) = 28
•  Βέλτιστο κοινωνικό όφελος: 42 στο (s3, t3)
•  Άρα για αμιγείς στρατηγικές, PoA = 42/7 = 6
16
Παράδειγμα 3
t1 t2 t3
s1 0, 0 3, 0 5, 0
s2 0, 2 24, 4 4, 2
s3 0, 8 2, 9 37, 5
•  2 σημεία ισορροπίας με αμιγείς στρατηγικές: (s1, t1), (s2, t2)
•  SW(s1, t1) = 0, SW(s2, t2) = 28
•  Βέλτιστο κοινωνικό όφελος: 42 στο (s3, t3)
•  Άρα για αμιγείς στρατηγικές, PoA = 42/0 = +∞
–  Πολύ κακό σημείο ισορροπίας το (s1, t1)

17
Bach or Stravinsky (BoS)
B S
B 2, 1 0, 0

S 0, 0 1, 2

Έχουμε συνολικά 3 σημεία ισορροπίας:


•  (Β, Β)
•  (S, S)
•  ((2/3, 1/3), (1/3, 2/3))

18
Bach or Stravinsky (BoS)
B S
B 2, 1 0, 0

S 0, 0 1, 2
Με αμιγείς στρατηγικές:
•  Βέλτιστο κοινωνικό όφελος = 3
•  PoA = 3/3 = 1
•  Όλα τα σημεία ισορροπίας με αμιγείς στρατηγικές επιτυγχάνουν
βέλτιστο όφελος!
•  Ό,τι καλύτερο μπορούσαμε να ελπίζουμε

19
Bach or Stravinsky (BoS)
B S
B 2, 1 0, 0

S 0, 0 1, 2
Με μεικτές στρατηγικές:
•  Βέλτιστο κοινωνικό όφελος = 3
•  Πρέπει να δούμε το όφελος στο σημείο (p, q) = ((2/3, 1/3), (1/3,
2/3))
-  SW(p, q) = 2/3 x 1/3 x 3 + 1/3 x 2/3 x 3 = 12/9 = 4/3
PoA = 3/(4/3) = 9/4
20
Συμπεράσματα
•  Στο Bach-or-Stravinsky το σημείο ισορροπίας με μεικτές
στρατηγικές είναι υποδεέστερο αναφορικά με το κοινωνικό
όφελος
•  Πιο γενικά, όταν υπάρχουν ισορροπίες και με μεικτές και με
αμιγείς στρατηγικές:
PoA για αμιγείς ≤ PoA για μεικτές

21

You might also like