Game Theory Lecture 4 NE Applications - 2020

第四讲：纳什均衡及应用
回顾
• 最优反应映射（函数）：针对其他人的每一种可能的行动组合，
自己的最优行动是什么
− 当博弈的策略空间是“离散”的，一般通过收益矩阵和“画圈法”进行
− 当博弈的策略空间是“连续”的，一般通过寻找收益函数的极值点进行
 “一阶条件”：收益函数的一阶导数为零
• 纳什均衡是最优反应映射（函数）的交集（点）
• 在解决具体问题的时候，往往需要灵活的选择
− 使用纳什均衡的概念
− 使用最优反应法
− 分析占优(dominance)关系
公共品(Public Goods)博弈
• 多人一起进行公共品生产（一经产出，所有人共享）
− 例如国防、环境、群体合作、集体行动…
• 对于博弈者i
− 公共品生产：𝑦 𝑥 , 𝑥 , … , 𝑥
− 付出的成本：𝑐 𝑥
− 收益：𝑢 v 𝑦 𝑐 𝑥
• 一般来说，纳什均衡中公共品的供应不足；但是具体情况要
根据 y，c 和 v 的具体形式而定。
公共品博弈例一：实验室里的常见形式
• 五名博弈者，各有初始资金100元。可选择投资到一个公共基金中，投入
记为xi。投入的金额会增值成为原来的3倍。基金增值后五人平分其金额
（无论自己投入多少）。纳什均衡中每人会投入多少？
• 对于博弈者1来说，其净收益： 𝑢 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥
0.4𝑥 0.6 ∑ 𝑥
• 他的最优反应：把x2 … x5看作给定，选择x1 以最大化 u1
• 显然，最优的x1 =0
• 同理，对于任意博弈者i而言，最优反应是： xi = 0
• 纳什均衡为(0, 0, 0, 0, 0)：每人投入0，所得净收益也为0
• 但是如果每人都投入100元，每人净收益200元，远远超过均衡中所得！
外部性 (Externality)
• 外部性：自己的行动所带来的后果，没有被决策者考虑在内的部分
• 对于任一个博弈者（比如博弈者1）而言，最大化净收益𝑢
𝑢 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 0.4𝑥 0.6 ∑ 𝑥
• 可以看到，对于个体而言，每投入1元，尽管产生3元的总的回报，但
是由于是5个人平分，自己只能拿到3/5元，所以净亏损0.4元
• 自己投入1元，还提高了其他人的收益2.4元，自利的行动者并不考虑
• 如果博弈者1考虑自己行动的全部后果，即试图最大化∑ 𝑢
∑𝑢 3 𝑥 ⋯ 𝑥 𝑥 ⋯ 𝑥 2𝑥 2∑ 𝑥
最优选择显然是𝑥 越大越好，即投入越多越好
公共品博弈例二：存在的“门槛”情况
• 如果回报不是“平滑的”，而是有断裂或者突然变化的点（门槛）
• 例如：每人初始资源为100，2人投入总和为 X 𝑥 𝑥 。如果X ≥ 100，回
报为1.6X；但是如果 X < 100，回报为0 。回报总是两人平分
• 博弈者1的净收益记为u1
.
𝑥 𝑥 𝑥 if 𝑥 𝑥 100
𝑢
𝑥 if 𝑥 𝑥 100
• 首先，如果总投入高于门槛，𝑥 𝑥 100，那么这是前面分析的情况，每
一方有动力减少投入，无法构成均衡
• 如果总投入低于门槛，每一方都有动力将投入降为零，这种情况下，只有双
方选择 (0, 0) 构成纳什均衡
• 如果总投入正好在门槛上，能否形成均衡？
公共品博弈例二：存在的“门槛”情况
.
𝑢
• 如果总投入正好在门槛上，𝑥 𝑥 100
− 如果1降低投入，∆𝑥 0，会使得自己的净收益降为 𝑥 0
.
− 如果保持此时的投入（停留在门槛上），𝑢 𝑥 𝑥 𝑥
80 𝑥 ，显然只要 0，即𝑥 80，则没有动力改变
− 所以，𝑥 𝑥 100的组合（例如(50, 50), (60, 40)…）都可以构成
纳什均衡；不过自己最大的投入不超过80（对方至少要投入20）
• NE = 𝑥 ,𝑥 𝑥 𝑥 100, 𝑥 , 𝑥 ∈ 20, 80 ∪ 0, 0
.
𝑢
x2
• 我们也可以通过最优反应法来分析 100 B1(x2)
• 1的最优反应映射
80
− 如果x2 = 100，1的最优反应是0
− 如果100 > x2 > 20，1的最优反应是
100—x2
− 如果x2= 20，1的最优反应是80或者0 20
− 如果x2 < 20，1的最优反应是0

20 80 100 x1
x2
100
80
• 2的最优反应映射与之对称
B2(x1)
20
20 80 100 x1
x2
100
• 纳什均衡
− 𝑥 𝑥 100, 𝑥 , 𝑥 ∈ 20, 80 80
− (0, 0) NE
• 在总投入X=100这个关键点，可以形成
多个纳什均衡，称为“供应点”
• 在供应点以下，非合作性均衡也仍然存 20
在：（0，0）也是纳什均衡
20 80 100 x1
NE
公共品博弈例三：有供应点的多人博弈
• 例如：5人投入总和X，如果X大于等于100，收益为3X；但是如果
X小于100，收益为0 。（每个人初始资源为100）
− 门槛以上
 不是，因为任何一个博弈者可以降低投入，提高自己的净收入
− 门槛以下？只有(0, 0, 0, 0, 0) 是均衡
− 正好在门槛上：例如(20, 20, 20, 20, 20)，或者(0, 0, 0, 40, 60), 等等,
在总投入X=100这个点，存在各种纳什均衡（但是任何人的投入不
超过60）
时机博弈 (Game of Timing)
• 两名男生倾慕同一位女生，都想邀请她与自己在假期外出旅行。现在
到假期还有10天时间，两人都在精心准备自己的邀请。准备的越充分，
成功的可能性越大。具体而言，如果女生还没有被约走，在第 t 天
（ 1 t 10）提出邀请，成功的可能性是 t/10。如果双方同一天提出
邀请，各自成功的概率是1/2。每人只能邀请一次。女生只会和小于等
于一位男生外出。（博弈者的目标是最大化邀请成功的概率。且为简
单起见，如果两种行动带来的成功概率相等，他总是选时间靠前的那
一种）
• 显然，如果不考虑对方，越晚提出邀请，成功的把握越大
• 但是，如果别人早提出邀请，就可能抢占先机
• 最优反应、纳什均衡？
考虑博弈者1的最优反应
• 如果对方在t2=1提出邀请，1的最优反应是？
− 在t1=10提出邀请，成功的概率是1 ‐ 1/10 = 9/10
• 如果对方在t2=2提出邀请，1的最优反应？
− 先发制人：成功概率 (t2‐1)/10 = 1/10
− 后发制人：t1=10，成功概率 1 ‐ t2/10 = 8/10
− 同时：成功概率 1/2
• 同理，对于任何t2 < 5，1的最优反应是“后发制人”，选择t1=10
• 对于t2 = 5，1选择后发t1=10的成功概率是1/2，等于选同时，所以选t1=5
• 对于t2 = 6，1选择先发t1=5的成功概率是1/2，等于选同时，所以选t1=5
• 对于t2 > 6，1的最优反应
− 先发制人！因为选择“后发”的成功概率小于1/2
一般原则：是先发制人还是后发制人？
• 在一个时间点t，pi(t)是自己在该点（以前）出手成功的
概率, pj(t) 是对方在该点出手成功的概率
• 比较： pi(t) 与 1—pj(t)
• 即比较自己出手的成功概率与对方出手失败的概率
− 自己出手成功的概率较大时，先发制人
− 对方出手失败的概率较大时，后发制人
时机博弈 t2 b1(t2)
10
• 博弈者1的最优反应如右图
1
5 10
1 t1
时机博弈 t2
10
• 博弈者2的最优反应 b2(t1)
1
5 10
1 t1
时机博弈 t2 b1(t2)
10
• 纳什均衡是(5，5) b2(t1)
5
• 军事上的先发制人和后发制人
NE
• 商业竞争中的新产品发布时机
1
5 10
• 时机竞争的代价 1 t1
− 时机竞争并未带来更高质量的方案（当然时间更早）
− 对于提高质量而言，不开展时机竞争更好（比如设定一个单一的截止日
期）
Hotelling 选举模型：两位候选人
• 候选人可以在一个连续的政策空间内选择自己的竞选立场xi:
0 xi xj 1
• 每一位选民都有自己最偏好的一个政策立场，离这个点越远的政策带
给他的效用越小；所以每位选民投票给立场离自己偏好最近的候选人
• 为了简单起见，我们不妨进一步假设选民的政策偏好均匀的分布在[0,1]
的空间上（后面的结论不依赖于这个假设，在任何分布形式下都成立）
可想象每个点上都有一个选民
• 正好排在中间的选民，称为“中位数选民”(median voter)，立场为m
• 有两名候选人参选，得票多者当选，得票相同为“平局”(tie)。候选
人的偏好是：当选 ≻ 平局 ≻ 落选。
0 x2 m x1 1
• 任何一个候选人可以获得自己一侧的选民，以及自己和对方
之间的一半选民
• 所以候选人力图扩大自己独占的这一侧的空间
x1
0 x2 m 1
• 可以看出，m是一个特别有利的点，占住m可以保证至少拿到一
半的选票
• (m, m) 是纳什均衡
• 任何其他的点(x1, x2)都不可能是纳什均衡，可以证明（课后思考）
• “中位数选民(median voter)”定理
− 可帮助我们理解两党制情况下，两党向中间靠拢的现象
− 但是注意这里使用的一些限制性前提假设，如政策空间是一维的，
候选人只关心当选（没有自己的政治偏好）等
0 x2 m x1 1
或者，用最优反应法分析
• 最优反应
− 给定一个候选人的立场，另一个候选人只要选择比他更不极端、更
靠近中位数m的立场就可以获胜
• 如果x2 < m，那么1的最优反应是在x2右侧，且比x2离m更近
𝑥 𝑥 且 𝑚
即：𝑥 𝑥 2𝑚 𝑥
• 如果x2 > m，那么1的最优反应是 𝑥 𝑥 且 𝑚
即：2𝑚 𝑥 𝑥 𝑥
• 如果x2= m，那么1的最优反应是 x1 = m
博弈者1的最优反应映射：B1(x2) 博弈者2的最优反应映射：B2(x1)
x2 x2
2m x2 =2m – x1 x2 = x 1
2m
2𝑚 𝑥 𝑥 𝑥
x1 = x 2
m 𝑥 𝑥 2𝑚 𝑥 2𝑚 𝑥 𝑥 𝑥
x1 =2m ‐ x2
𝑥 𝑥 2𝑚 𝑥
2m x1 m 2m x1
• 两者交集：{(m, m)}
Hotelling 模型也是占优可解的
• 严格劣势策略？
− 两个端点
− m总是严格优于端点
• 裁去端点之后，严格劣势策略？
− 剩下的端点
• 不断裁剪…
• 只剩下中间的m
反复删除劣势策略与纳什均衡
• 占优可解——反复删除（严格）劣势策略——与纳什均衡的关系
• 定理：使用反复剔除严格劣势策略将博弈简化之后，所有原博弈
的纳什均衡都仍然得以保留
• 而且，如果使用反复剔除严格劣势策略的方法可将博弈简化到唯
一的行动组合，那么该行动组合是唯一的纳什均衡
反复剔除严格劣势策略
B S X S X
B 3，1 0，0 ‐1，2 B 0，0 ‐1，2
S 0，0 1，3 0，2 S 1，3 0，2
S X
S 1，3 0，2
S
(S, S) 是纳什均衡吗？ S 1，3
反复删除劣势策略与纳什均衡
• 显然并非所有的博弈都能以这种方法求解纳什均衡
− 有的博弈并无严格劣势策略
− 反复剔除严格劣势策略不一定只留下唯一的行动组合
• 如果反复剔除弱劣势策略，有时也会帮助我们发现纳什
均衡

Game Theory Lecture 4 NE Applications - 2020

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Game Theory Lecture 4 NE Applications - 2020

Uploaded by

Copyright:

Available Formats

第四讲：纳什均衡及应用

− 如果x2 < 20，1的最优反应是0

You might also like