Download as pdf or txt
Download as pdf or txt
You are on page 1of 26

第四讲:纳什均衡及应用

回顾
• 最优反应映射(函数):针对其他人的每一种可能的行动组合,
自己的最优行动是什么
− 当博弈的策略空间是“离散”的,一般通过收益矩阵和“画圈法”进行
− 当博弈的策略空间是“连续”的,一般通过寻找收益函数的极值点进行
 “一阶条件”:收益函数的一阶导数为零

• 纳什均衡是最优反应映射(函数)的交集(点)

• 在解决具体问题的时候,往往需要灵活的选择
− 使用纳什均衡的概念
− 使用最优反应法
− 分析占优(dominance)关系
公共品(Public Goods)博弈
• 多人一起进行公共品生产(一经产出,所有人共享)
− 例如国防、环境、群体合作、集体行动…
• 对于博弈者i
− 公共品生产:𝑦 𝑥 , 𝑥 , … , 𝑥
− 付出的成本:𝑐 𝑥
− 收益:𝑢 v 𝑦 𝑐 𝑥
• 一般来说,纳什均衡中公共品的供应不足;但是具体情况要
根据 y,c 和 v 的具体形式而定。
公共品博弈例一:实验室里的常见形式
• 五名博弈者,各有初始资金100元。可选择投资到一个公共基金中,投入
记为xi。投入的金额会增值成为原来的3倍。基金增值后五人平分其金额
(无论自己投入多少)。纳什均衡中每人会投入多少?
• 对于博弈者1来说,其净收益: 𝑢 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥
0.4𝑥 0.6 ∑ 𝑥
• 他的最优反应:把x2 … x5看作给定,选择x1 以最大化 u1
• 显然,最优的x1 =0
• 同理,对于任意博弈者i而言,最优反应是: xi = 0
• 纳什均衡为(0, 0, 0, 0, 0):每人投入0,所得净收益也为0
• 但是如果每人都投入100元,每人净收益200元,远远超过均衡中所得!
外部性 (Externality)
• 外部性:自己的行动所带来的后果,没有被决策者考虑在内的部分
• 对于任一个博弈者(比如博弈者1)而言,最大化净收益𝑢

𝑢 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 0.4𝑥 0.6 ∑ 𝑥
• 可以看到,对于个体而言,每投入1元,尽管产生3元的总的回报,但
是由于是5个人平分,自己只能拿到3/5元,所以净亏损0.4元
• 自己投入1元,还提高了其他人的收益2.4元,自利的行动者并不考虑
• 如果博弈者1考虑自己行动的全部后果,即试图最大化∑ 𝑢
∑𝑢 3 𝑥 ⋯ 𝑥 𝑥 ⋯ 𝑥 2𝑥 2∑ 𝑥
最优选择显然是𝑥 越大越好,即投入越多越好
公共品博弈例二:存在的“门槛”情况
• 如果回报不是“平滑的”,而是有断裂或者突然变化的点(门槛)
• 例如:每人初始资源为100,2人投入总和为 X 𝑥 𝑥 。如果X ≥ 100,回
报为1.6X;但是如果 X < 100,回报为0 。回报总是两人平分
• 博弈者1的净收益记为u1
.
𝑥 𝑥 𝑥 if 𝑥 𝑥 100
𝑢
𝑥 if 𝑥 𝑥 100
• 首先,如果总投入高于门槛,𝑥 𝑥 100,那么这是前面分析的情况,每
一方有动力减少投入,无法构成均衡
• 如果总投入低于门槛,每一方都有动力将投入降为零,这种情况下,只有双
方选择 (0, 0) 构成纳什均衡
• 如果总投入正好在门槛上,能否形成均衡?
公共品博弈例二:存在的“门槛”情况
.
𝑥 𝑥 𝑥 if 𝑥 𝑥 100
𝑢
𝑥 if 𝑥 𝑥 100

• 如果总投入正好在门槛上,𝑥 𝑥 100
− 如果1降低投入,∆𝑥 0,会使得自己的净收益降为 𝑥 0
.
− 如果保持此时的投入(停留在门槛上),𝑢 𝑥 𝑥 𝑥
80 𝑥 ,显然只要 0,即𝑥 80,则没有动力改变
− 所以,𝑥 𝑥 100的组合(例如(50, 50), (60, 40)…)都可以构成
纳什均衡;不过自己最大的投入不超过80(对方至少要投入20)
• NE = 𝑥 ,𝑥 𝑥 𝑥 100, 𝑥 , 𝑥 ∈ 20, 80 ∪ 0, 0
.
𝑥 𝑥 𝑥 if 𝑥 𝑥 100
𝑢
𝑥 if 𝑥 𝑥 100

x2
• 我们也可以通过最优反应法来分析 100 B1(x2)
• 1的最优反应映射
80
− 如果x2 = 100,1的最优反应是0
− 如果100 > x2 > 20,1的最优反应是
100—x2
− 如果x2= 20,1的最优反应是80或者0 20

− 如果x2 < 20,1的最优反应是0


20 80 100 x1
x2
100

80
• 2的最优反应映射与之对称

B2(x1)
20

20 80 100 x1
x2
100
• 纳什均衡
− 𝑥 𝑥 100, 𝑥 , 𝑥 ∈ 20, 80 80
− (0, 0) NE
• 在总投入X=100这个关键点,可以形成
多个纳什均衡,称为“供应点”
• 在供应点以下,非合作性均衡也仍然存 20
在:(0,0)也是纳什均衡

20 80 100 x1
NE
公共品博弈例三:有供应点的多人博弈
• 例如:5人投入总和X,如果X大于等于100,收益为3X;但是如果
X小于100,收益为0 。(每个人初始资源为100)
− 门槛以上
 不是,因为任何一个博弈者可以降低投入,提高自己的净收入
− 门槛以下?只有(0, 0, 0, 0, 0) 是均衡
− 正好在门槛上:例如(20, 20, 20, 20, 20),或者(0, 0, 0, 40, 60), 等等,
在总投入X=100这个点,存在各种纳什均衡(但是任何人的投入不
超过60)
时机博弈 (Game of Timing)
• 两名男生倾慕同一位女生,都想邀请她与自己在假期外出旅行。现在
到假期还有10天时间,两人都在精心准备自己的邀请。准备的越充分,
成功的可能性越大。具体而言,如果女生还没有被约走,在第 t 天
( 1 t 10)提出邀请,成功的可能性是 t/10。如果双方同一天提出
邀请,各自成功的概率是1/2。每人只能邀请一次。女生只会和小于等
于一位男生外出。(博弈者的目标是最大化邀请成功的概率。且为简
单起见,如果两种行动带来的成功概率相等,他总是选时间靠前的那
一种)

• 显然,如果不考虑对方,越晚提出邀请,成功的把握越大
• 但是,如果别人早提出邀请,就可能抢占先机
• 最优反应、纳什均衡?
考虑博弈者1的最优反应
• 如果对方在t2=1提出邀请,1的最优反应是?
− 在t1=10提出邀请,成功的概率是1 ‐ 1/10 = 9/10
• 如果对方在t2=2提出邀请,1的最优反应?
− 先发制人:成功概率 (t2‐1)/10 = 1/10
− 后发制人:t1=10, 成功概率 1 ‐ t2/10 = 8/10
− 同时:成功概率 1/2
• 同理,对于任何t2 < 5,1的最优反应是“后发制人”,选择t1=10
• 对于t2 = 5,1选择后发t1=10的成功概率是1/2,等于选同时,所以选t1=5
• 对于t2 = 6,1选择先发t1=5的成功概率是1/2,等于选同时,所以选t1=5
• 对于t2 > 6,1的最优反应
− 先发制人!因为选择“后发”的成功概率小于1/2
一般原则:是先发制人还是后发制人?

• 在一个时间点t,pi(t)是自己在该点(以前)出手成功的
概率, pj(t) 是对方在该点出手成功的概率
• 比较: pi(t) 与 1—pj(t)
• 即比较自己出手的成功概率与对方出手失败的概率
− 自己出手成功的概率较大时,先发制人
− 对方出手失败的概率较大时,后发制人
时机博弈 t2 b1(t2)
10

• 博弈者1的最优反应如右图

1
5 10
1 t1
时机博弈 t2
10

• 博弈者2的最优反应 b2(t1)

1
5 10
1 t1
时机博弈 t2 b1(t2)
10

• 纳什均衡是(5,5) b2(t1)

5
• 军事上的先发制人和后发制人
NE
• 商业竞争中的新产品发布时机
1
5 10
• 时机竞争的代价 1 t1
− 时机竞争并未带来更高质量的方案(当然时间更早)
− 对于提高质量而言,不开展时机竞争更好(比如设定一个单一的截止日
期)
Hotelling 选举模型:两位候选人
• 候选人可以在一个连续的政策空间内选择自己的竞选立场xi:

0 xi xj 1

• 每一位选民都有自己最偏好的一个政策立场,离这个点越远的政策带
给他的效用越小;所以每位选民投票给立场离自己偏好最近的候选人
• 为了简单起见,我们不妨进一步假设选民的政策偏好均匀的分布在[0,1]
的空间上(后面的结论不依赖于这个假设,在任何分布形式下都成立)
可想象每个点上都有一个选民
• 正好排在中间的选民,称为“中位数选民”(median voter),立场为m
• 有两名候选人参选,得票多者当选,得票相同为“平局”(tie)。候选
人的偏好是:当选 ≻ 平局 ≻ 落选。
0 x2 m x1 1

• 任何一个候选人可以获得自己一侧的选民,以及自己和对方
之间的一半选民
• 所以候选人力图扩大自己独占的这一侧的空间
x1

0 x2 m 1

• 可以看出,m是一个特别有利的点,占住m可以保证至少拿到一
半的选票
• (m, m) 是纳什均衡
• 任何其他的点(x1, x2)都不可能是纳什均衡,可以证明(课后思考)
• “中位数选民(median voter)”定理
− 可帮助我们理解两党制情况下,两党向中间靠拢的现象
− 但是注意这里使用的一些限制性前提假设,如政策空间是一维的,
候选人只关心当选(没有自己的政治偏好)等
0 x2 m x1 1

或者,用最优反应法分析
• 最优反应
− 给定一个候选人的立场,另一个候选人只要选择比他更不极端、更
靠近中位数m的立场就可以获胜
• 如果x2 < m,那么1的最优反应是在x2右侧,且比x2离m更近
𝑥 𝑥 且 𝑚
即:𝑥 𝑥 2𝑚 𝑥
• 如果x2 > m,那么1的最优反应是 𝑥 𝑥 且 𝑚
即:2𝑚 𝑥 𝑥 𝑥
• 如果x2= m,那么1的最优反应是 x1 = m
博弈者1的最优反应映射:B1(x2) 博弈者2的最优反应映射:B2(x1)
x2 x2
2m x2 =2m – x1 x2 = x 1
2m
2𝑚 𝑥 𝑥 𝑥

x1 = x 2

m 𝑥 𝑥 2𝑚 𝑥 2𝑚 𝑥 𝑥 𝑥

x1 =2m ‐ x2

𝑥 𝑥 2𝑚 𝑥

2m x1 m 2m x1
• 两者交集:{(m, m)}
Hotelling 模型也是占优可解的
• 严格劣势策略?
− 两个端点
− m总是严格优于端点
• 裁去端点之后,严格劣势策略?
− 剩下的端点
• 不断裁剪…
• 只剩下中间的m
反复删除劣势策略与纳什均衡
• 占优可解——反复删除(严格)劣势策略——与纳什均衡的关系
• 定理:使用反复剔除严格劣势策略将博弈简化之后,所有原博弈
的纳什均衡都仍然得以保留
• 而且,如果使用反复剔除严格劣势策略的方法可将博弈简化到唯
一的行动组合,那么该行动组合是唯一的纳什均衡
反复剔除严格劣势策略
B S X S X
B 3,1 0,0 ‐1,2 B 0,0 ‐1,2
S 0,0 1,3 0,2 S 1,3 0,2

S X
S 1,3 0,2

S
(S, S) 是纳什均衡吗? S 1,3
反复删除劣势策略与纳什均衡
• 显然并非所有的博弈都能以这种方法求解纳什均衡
− 有的博弈并无严格劣势策略
− 反复剔除严格劣势策略不一定只留下唯一的行动组合

• 如果反复剔除弱劣势策略,有时也会帮助我们发现纳什
均衡

You might also like