Download as pdf or txt
Download as pdf or txt
You are on page 1of 67

经济金融学中

常用的实证研究方法
安泰经管学院金融系
覃 筱
QIN Xiao

致谢:部分课件参考了哥伦比亚大学姜纬教授和北京大学刘晓蕾教授的学术讲座。
实证研究的目的是什么?

n 理解经济世界(金融体系)的运行规则。

n 以此为基础,提供决策建议:
q 政府

q 企业

q 个人

——找到这些问题的答案需要确定变量之间的关系。
尤其是因果关系!

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 2
Outline

n 内生性、相关关系与因果关系

n 因果推断中常用的实证研究方法

n 附录
q 参考书(实证方法部分)
q 参考代码

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 3
遗漏变量

n 《美国流行病学杂志》的一项研究指出:
q 单身女性比已婚女性,寿命减少了7-15年;
q 单身男性则更短命,寿命比已婚男性少了8-17年。
q 将“是否单身”作为自变量(X),“寿命”作为因变量(Y
),回归结果显示二者的相关关系十分显著。
n 这是否能得出“长期单身少活十年”的结论呢?
q 在“是否单身”和“寿命短”两个变量的影响路径中,还有
许多看不见的变量起作用,即遗漏变量(omitted vari
able)
n 穷、忙、基因……

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 4
反向因果

n 研究发现,董事会每年召开会议次数(X)越
多,公司表现(Y)越差。
q 对模型Y = α + β * X进行回归,得到β系数显著
为负。

n 这能证明“董事会会议导致公司表现差”吗?

n 互为因果(simultaneity)/反向因果(
reversed causality)
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 5
内生性问题

n 内生性(endogeneity):一个或多个解释
变量与误差项存在相关关系。
q 遗漏变量(omitted variable)

q 互为因果(simultaneity)/反向因果(

reversed causality)
q 测量误差(measurement error)

q 选择性偏差(selection bias)

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 6
因果关系 VS 相关关系

n Causality ≠ Correlation因果关系 ≠ 相关关系


q X correlates with Y
q X causes Y
n “treatment” (X) & “counterfactual”
q “treatment”,研究感兴趣的解释变量(X)
q “treatment effect”,处理效应/处置效应
q “counterfactual”,如果没有“treatment”(其他不变
),观察到的数据(Y)会是什么样的。
n 不同于自然科学中的实验,社会科学中“counterfactual”通
常无法直接观察到。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 7
因果推断中常用的实证研究方法

n 1. 同卵双胞胎 (Identical twins)


n 2. 随机田野实验 (Randomized field experiment)
n 3. 准自然实验 (Quasi-natural experiment)
n 4. 断点回归设计 (Regression discontinuity design, R
D/RDD )
n 5. 工具变量 (Instrumental variable, IV)
n 6. 倾向得分匹配 (Propensity score matching, PSM)
n 7. 事件研究 (Event study)
n 8. 结构参数估计 (Structural estimation)

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 8
1. 同卵双胞胎

n 一对同卵双胞胎(假定?)
n 随机选取一个给予“treatment”,观察结果

n Y|treatment VS Y|no treatment


q Y|no treatment 就是“counterfactual”

n 对比Y|treatment & Y|no treatment,得出


“treatment”对Y产生的效果,可以知道
treatment(因) causes Y(果)
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 9
1. 同卵双胞胎-实例

n Estimating returns to education using twins in urban


China, by Hongbin Li, Pak Wai Liu, Junsen Zhang, JDE,
2012
n 数据:国家统计局城镇调查大队,2002年6月7月
对五个城市(成都、重庆、哈尔滨、合肥、武汉)18-
65 岁同卵双胞胎的调查结果。
q 488对同卵双胞胎,976人
n 研究问题:教育对收入的影响如何?
n 内生性问题:遗漏变量

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 10
1. 同卵双胞胎-实例

n OLS:收入 = a * 教育程度 + b * 其他控制变量


a = 0.084*** (14.14)
n 双胞胎FE:∆收入_双胞胎 = a * ∆教育程度_双胞胎
a = 0.027* (1.87)
n 双胞胎FE(按学历分组):
∆收入_双胞胎 = a * ∆教育程度_双胞胎
q 高中教育:a = - 0.003 (0.04)
q 技校教育:a = 0.168** (2.09)
q 大学教育:a = 0.278*** (2.45)

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 11
2. 随机田野实验

n 双盲实验——新药测试

n 实验组 VS 控制组不再是一一对应,存在异质
性(heterogeneity)。
n 但由于分组是随机的,观察不到的异质性与
“treatment”无关。

n Y|实验组 VS Y|控制组
q Y|控制组就是“counterfactual”

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 12
2. 随机田野实验-实例1

n 2003年SARS疫情发生后,SARS疫苗的研制确定为重要任务
之一。科技部积极组织协调,形成了由北京科兴生物制品有限
公司、中国疾病预防控制中心病毒病预防控制所和中国医学科
学院实验动物研究所共同组成的疫苗研制项目课题组,研究人
员包括北京科兴生物制品有限公司、中国医学科学院实验动物
研究所、中国疾病预防控制中心病毒病预防控制所、中日友好
医院等部门在内的100多位科研人员和医生。

n 2004年1月19日,SARS病毒灭活疫苗获准进入Ⅰ期临床研究,
本次试验共选择36名年龄在21岁到40岁的健康人作为志愿者,
男女各18人,在中日友好医院接受了SARS疫苗临床研究。免
疫接种分为16个单位和32个单位两种剂量,并设安慰剂对照组,
各12人。这次SARS疫苗临床研究方案完全按照国际规范,采
用知情同意、伦理审查、随机双盲等规范化操作。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 13
2. 随机田野实验-实例1

n 本次试验采用随机双盲的实验设计。受试者和参加临床试
验或临床评价的研究人员或疫苗研制方的工作人员均不知
道也不能识别受试者接受了何种注射(疫苗或安慰剂) 。在
试验结束、完成数据清理、数据已达到可以接受水平,可
由指定人员揭盲,打开密封的设盲信封,从而知道哪个受
试者接种的是试验疫苗,哪个受试者接种的是安慰剂。

n 2004年12月5日,科技部、卫生部、国家食品药品监督管
理局共同宣布:中国自主研制的SARS病毒灭活疫苗Ⅰ期
临床试验圆满结束。经对36人的试验结果表明,36位受试
者均未出现异常反应,其中24位接种疫苗的受试者全部产
生了抗体,这表明我国自主研制的疫苗是安全有效的。
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 14
2. 随机田野实验-实例2

n Does working from home work? Evidence from a Chinese


experiment, Nicholas Bloom, James Liang (梁建章), John Roberts
and Zhichun Ying, QJE, 2015
n 携程-上海呼叫中心,2010年,996个雇员。503
自愿回家工作,
q 249个符合实验要求。
n 可以用这249个人回家工作的表现和其他在公司
工作的人相比吗?为什么?
n 随机实验
q 实验组:抽签决定偶数日子出生的雇员回家工作;
q 控制组:奇数日子出生的雇员仍然留在公司上班。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 15
2. 随机田野实验-实例2

n 双重差分法Difference-in-Difference (DID)
正常时期 实验期 差值
(2010/1/1- (2010/12/6-
2010/11/28) 2011/08/14)
控制组(奇数生日) A B B-A
实验组(偶数生日) C D D-C
差值 C-A D-B DID双重差分
= (D-C)-(B-A)
Y = α + β * ExperimentTime + γ * Treatment + η *
ExperimentTime * Treatment + control + Ɛ
A: α B: α+β
C: α+γ D: α+β+γ+η
Difference-in-Difference (DID): η
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 16
2. 随机田野实验-实例2

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 17
3. 准自然实验

n 非研究者设计的实验
q 实验组与控制组不是研究者随机选择的,而是“
自然”选择的。

n “自然”选择,需要与“treatment”无关

n 常见的“自然选择”
q 政策/制度的变化

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 18
3. 准自然实验

n 习近平总书记(2020):在经济社会领域专家座
谈会的讲话
q “新时代改革开放和社会主义现代化建设的丰富实践是
理论和政策研究的‘富矿’,我国经济社会领域理论工作
者大有可为。”

n 丰富的实验田——中国的经济、金融制度改革
q 中国当代是一个巨大的经济管理学实验室,所发生的事
情非常有研究价值,国际学术界也非常关注与中国有关
的研究。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 19
作者 文章 刊物 政策
吴怡俐 增值税的税收中性、企业投资和企业价值— 《管理世界》 财税〔2018〕70号文“留抵退税”的政策
等 —基于“留抵退税”改革的研究 2021年第8期
张杰等 中国高新区“以升促建”政策对企业创新的激 《管理世界》 2009年《加快审批省级高新技术产业开发区
励效应 2021年第7期 升级为国家级高新技术产业开发区》
柳光强 政府会计监督如何影响盈余管理——基于财 《管理世界》 1999~2017年财政部会计信息质量随机检查
王迪 政部会计信息质量随机检查的准自然实验 2021年第5期 公告
尹志超 精准扶贫政策效果评估——家庭消费视角下 《管理世界》 2014年5月《建立精准扶贫工作机制实施方
郭沛瑶 的实证研究 2021年第4期 案》
曹春方 产权权利束分割与国企创新——基于中央企 《管理世界》 国资发改革〔2010〕148号文《关于在部分
张超 业分红权激励改革的证据 2020年第9期 中央企业开展分红权激励试点工作的通知》
李广众 财政层级改革与税收征管激励重构——以财 《管理世界》 中央政府在20世纪初期提出财政“省直管县”
贾凡胜 政“省直管县”改革为自然实验的研究 2020年第8期 改革
李永友 集权式财政改革能够缩小城乡差距吗?—— 《管理世界》 2003年安徽省和县、祁门等9个县开展“乡财
王超 基于“乡财县管”准自然实验的证据 2020年第4期 县管”改革试点
王欢欢 最低工资、法律制度变化和企业对外直接投 《管理世界》 2004年《最低工资规定》
等 资 2019年第11

连立帅 资本市场开放、非财务信息定价与企业投 《管理世界》 2014年、2016年先后实施的沪港、深港股
等 资——基于沪深港通交易制度的经验证据 2019年第8期 票市场交易互联互通机制试点
刘冲等 交通基础设施、金融约束与县域产业发展— 《管理世界》 “五纵七横”国道主干线工程
—基于“国道主干线系统”自然实验的证据 2019年第7期
陈冬华 政府行为必然会提高股价同步性吗?——基于 《经济研究》 “十一五”计划、“十二五”计划及“十三五”计划
姚振晔 我国产业政策的实证研究 2018年第12 的产业政策

陈胜蓝 卖空压力与控股股东私利侵占——来自卖空 《管理科学学 中国证监会自2010 年3 月试行融资融券交
卢锐 管制放松的准自然实验证据 报》2018 年 © 易,引入卖空机制
《学术写作、规范与伦理》,Copyrights 2023,覃筱 20
第4期
3. 准自然实验-实例1

n 周黎安,陈烨.中国农村税费改革的政策效果:基于双重差分模型的估计.
经济研究,2005(08):44-53.
n 研究问题:税费改革是否提高了收入?
n 准自然实验:中国7省591县和县级市税费改革
q Y: 农民人均纯收入增长率
q 实验组:参与税费改革的县市农民
q 控制组:未参与税费改革的县市农民
n 用于反映农村税费改革进程的变量有“税费改革” ,于该县进行税费改
革的当年和此后取值1,否则为0 ;
n “税费改革当年”,仅在税费改革当年取值1,否则取值0 ;
n “税费改革第i 年”(i = 1,2,3,4),分别当该县处于改革第i 年时等于1,
否则为0 。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 21
3. 准自然实验-实例1

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 22
3. 准自然实验-实例2
n 权小锋,尹洪英.中国式卖空机制与公司创新——基于融资融券分步扩
容的自然实验.管理世界,2017(01):128-144+187-188.

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 23
3. 准自然实验-实例2

n 研究问题:卖空机制如何影响公司的创新行为?
n 研究假设
q H1-A:如卖空机制符合“约束假说”,则卖空机制的实施
会显著提高公司的创新效率。
n 卖空机制的引入能抑制管理层在创新决策上的代理问题。
q 第一,卖空机制的引入,强化了管理层的长期激励。
q 第二,卖空机制的引入,增加了卖空者的外部监督机制。
q H1-B:如卖空机制符合“压力假说”,则卖空机制的实施
会显著降低公司的创新效率。
n 公司管理层迫于卖空机制的价格压力,将会更多关注短期的股
价和运营绩效,而牺牲和忽视公司的长期价值投资。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 24
3. 准自然实验-实例2

n 研究问题:卖空机制如何影响公司的创新
行为?
q Y
n 创新投入:研发支出
n 创新产出:专利产出
n 准自然实验:融资融券标的股票分步扩容
q 实验组:沪深两市上市公司中进入融资融券名
单的公司
q 控制组:未进入该名单的公司
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 25
3. 准自然实验-实例2

List:为融资融券公司的虚拟变量。
当该公司股票在样本期间纳入融资融
券名单,取值为1,否则为0。
Post:公司进入融资融券名单之后的
年度,取值为1,否则为0。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 26
DID使用中需要注意的问题

n 实验组与控制组之间是否存在不同的时间趋势
q 平行趋势检验,若不通过,还需增加时间趋势控制变量

n 多时点DID(Staggered DID):如果政策实施时
间不同,可以利用实施时间上的差别来确定因果
。(假定:实施时间与研究问题不相关)
q As Certain as Debt and Taxes: Estimating the Tax Sensitivity of
Leverage from State Tax Changes, Florian Heider & Alexander
Ljungqvist, Journal of Financial Economics, 2015
q 褚剑,方军雄.中国式融资融券制度安排与股价崩盘风险的恶化.经济
研究,2016,51(05):143-158.

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 27
4. 断点回归设计

n 分组不随机;
n 但是在某个关键点(cut-off point),出现断点,一
个观测值在断点附近位置,落在哪边是随机的。
q 外力决定的,不可控的,非内生的
q 一定存在某个exogenous effect
n 研究问题:上交大对未来的成就有用吗?
q 分组:上交大的学生 VS 没上交大的学生?
q 断点:2023年交大金融专硕的复试分数线是360
n 359 VS 361 是运气决定的,随机的

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 28
4. 断点回归设计

n RDD中的三类变量
q 驱动变量(forcing variable, �� )
n �� :分数

q 处理变量(treatment, �� )
1             �� ≥ 360
n �� =
 0             �� < 360
q 结果变量(result, �� )
n 未来成就,如工资水平

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 29
4. 断点回归设计

n Sharp RDD
q 断点是明确的
n 360分上线
n Fuzzy RDD
q 在断点处,处理变量不是从0到1的变化,只是增大
了取值为1的概率
�1 (�� )    �� ≥ 360
�[�� = 1|�� ] = �1 (�� )>�0 (�� )
�0 (�� )     �� < 360
q 超过某个断点,成为实验组的可能性增加

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 30
4. 断点回归设计

n 基本思想:利用政策规则上的非连续特征, 政策
规则使得当某个可观测的特征变量等于或大于某
阈值时经济个体就会受到处理。
q 只要经济个体不能完全操纵驱动变量,那么因变量的非
连续变动就可以视作是由处理状态引起的。
n 估计方法
q 非参数IV估计
q 参数2SLS估计
n 第一阶段:�� = � + �(�� ) + ��� +��

n 第二阶段:�� = � + ��� + �(�� ) + ��

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 31
4. 断点回归设计-实例

n 张川川,陈斌开.“社会养老”能否替代“家庭养老”?——来自中国新型农
村社会养老保险的证据.经济研究, 2014, 49 (11): 102-115.
n 研究问题:“社会养老”能否替代“家庭养老”?
q 以“新农保”为基础的农村“社会养老”模式对“家庭养老”的替代性。检
验新农保养老金与私人转移支付的因果关系。
n 新农保试点《指导意见 》:养老金待遇的领取遵循年龄规则,年满60
周岁才可以领取养老金。
n 中国健康与养老追踪调查(CHARLS)
q Y
n 是否从子女处获得私人转移支付 / 是否从任何亲属(包括子女)或朋
友获得私人转移支付;
n 从子女处获得的私人转移支付的额度 / 从任何亲属或朋友处获得的私
人转移支付的额度。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 32
4. 断点回归设计-实例

断点:60.5岁
实验组:60.5岁及以上
控制组:60.5岁以下

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 33
4. 断点回归设计-实例

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 34
4. 断点回归设计-实例
Band
width
带宽

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 35
RDD使用中需要注意的问题

n Placebo test安慰剂检验:随机选取其他点,
作为断点,检查结果是否存在
n “treatment”在断点处是否连续分布
n 其他控制变量在断点处是否连续分布
n 在local test中,尝试不同的bandwidth
n 在global test中,考虑polynomial function
form

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 36
5. 工具变量

n �=�+�∗ X+�

n 内生性问题:���(X, �) ≠ 0

n 有效的工具变量
q 相关性条件Relevance condition: ���(��,
X) ≠ 0 
n Can be checked
q 外生性条件��������� ������
���: ���(��, � ) = 0
37
n Cannot《学术写作、规范与伦理》,Copyrights
be checked, usu. needs economic
© 2023,覃筱
intuition
5. 工具变量

n 找一个筛子,把X中和�相关的部分筛掉,只剩下正交的
部分,这样OLS就又有用了——工具变量就是这个筛子。

n 两阶段最小二乘法(2SLS)
q 第一阶段(X ~ IV + �1):把X分成两个部分——由IV决定的部分
+和IV无关的部分,这两者正交。
q 第二阶段(Y ~ � + �2):用第一阶段回归后的拟合值�代替X,
代入原方程回归。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 38
5. 工具变量-实例
n Angrist, Joshua D., and William N. Evans. Children and their
parents‘ labor supply: evidence from exogenous variation in family
size. AER,1998: 450-477.
n 研究问题:生育率如何影响父母劳动力供给?
n 内生性问题:不一定是子女数量增加导致的父母劳动参与
率低,很有可能是反向因果。父母本来劳动参与率就低,
才去生娃。
n 工具变量:寻找影响子女数目的外生冲击。逻辑上与子女
数目有关,但是与父母劳动市场参与无关的变量。
q 双胞胎
q 流产失败
q 头两个孩子的性别构成(该文)

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 39
5. 工具变量-实例

n 如果使用IV之后结果仍然成立,则可以证明确实
是子女数量增加(因)导致的父母劳动参与率低
(果) 。
子女数量(X) 父母劳动参与(Y)

(IV)
双胞胎
流产失败
前两胎性别相同
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 40
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 41
因变量 内生变量 工具变量 文献   因变量 内生变量 工具变量 文献
殖民时代的 Acemoglu et al.
政治制度  劳动力流动 空气流通系数 孙伟增等(2019)
死亡率 (2001)

Arceo et al.
婴儿死亡率、
(2016); Chen et al.
学生出勤、
1919 年基督 (2018); Chen et al.
产权保护制度 方颖&赵扬(2011)  心理健康、 逆温强度
教小学人数 (2020); Sager
交通事故、
(2019); Deschene
肥胖
et al. (2020)
经济增长 空气污染

Herrnstadt&Muehl
egger (2015);
犯罪、医疗
Barwick et al.
政府效率 语言多样性 Mauro (1995)  
成本、失眠、 风向与地理特征
(2018); Heyes &
出行
Zhu (2019); Chen
et al. (2020)
Schlenker&Walker
高速公路 最小生成树 Faber (2014)   居民健康 机场拥堵程度
(2015)
学校建造的
兄弟姐妹的性别构 Angrist& Evans
区域与时间 Duflo (2001)   劳动供给 生育率
成 (1998)
差异
家与大学的 教育、劳动 Bronars&Grogger
Card (1995)   非婚生育率 双胞胎出现频率
受教育程度 距离 供给 (1994)
个人收入
Angrist &Krueger 因最大班级规模造 Angrist&Lavy
出生季度   班级规模
(1991) 成的非连续性 (1999)
学习成绩
文革是否上 Fleisher & Wang
  学校数量 河流数量 Hoxby (2000)
高中,距离 (2005)
是否越战退伍军人 入伍抽签 Angrist (1990)   犯罪 警察 选举周期 Levitt (1997)
内战爆发 市场分割程
经济增长 降雨量 Miguel et al. (2004)   方言 当地戏曲种类 丁从明等(2018)
率 度
Evans& Ringel 当地土地平坦度、 42
出生体重 母亲吸烟 《学术写作、规范与伦理》,Copyrights
州香烟税率
(1999)
  房价 ©住宅供应量
2023,覃筱 湖泊数量 Saiz (2010)
IV使用中需要注意的问题

n 找工具变量需要开脑洞,大胆联想,小心求证。
n Weak IV问题和检验
n 如果IV数量多于内生性变量数量,over-
identification test
n 一个干净的IV 好于多个不干净的IV
n OLS 与IV的结果相比,系数大小变化是否与预测
的方向一致
n Exclusion condition无法测试,但需要提供足够的
economic intuition支持

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 43
6. 倾向得分匹配

n 倾向得分匹配Propensity score matching


(PSM)
q 由Rosenbaum和Rubin(1983,Biometrika)提出。

n 匹配思想
q 找到一个控制组的个体,使其与实验组的个体在除自变
量之外的其他各个方面都相似(匹配);
q 然后就可以通过自变量的差异(因),解释因变量的差
异(果)。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 44
6. 倾向得分匹配

n 实验组(高研发投入)
n 控制组(低研发投入)
q 由此直接计算研发投入带来的处理效应(treatment effect),结果
不可信,因为两组还有很多其他差异可能造成结果差异。

研发投入 公司业绩
匹配变量
规模
杠杆率
行业
公司治理
q 假如有两家公司的研发投入明显不同,但是其他各方面(匹配变量
)高度相似,就可以将业绩的差异归因到研发投入的差异。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 45
6. 倾向得分匹配

n 倾向得分(Propensity score):个体进入实验组的概率
ei = Pr (treatment = 1| Xi)
n 常见的匹配方法
q 最邻近匹配(Nearest neighbor matching):将控制组中与处理组倾向得
分差异最小的个体进行匹配。虽然处理组所有个体都能匹配成功,但是不放弃任一
处理组个体可能影响匹配质量,降低处理效应的精确度。
q 半径匹配(Radius matching):事先设定半径,找到所有设定半径范围内的
单位圆中的控制样本,半径取值为正。随着半径的降低,匹配的要求越来越严。
q 核匹配(Kernel matching):将处理组样本与由控制组所有样本计算出的一
个估计效果进行配对,其中估计效果由处理组个体得分值与控制组所有样本得分值
加权平均获得,而权数则由核函数计算得出。
q 分层匹配(Stratification matching):根据估计的倾向得分将全部样本分块
,使得每块的平均倾向得分在处理组和控制组中相等。
q 马氏距离(Mahalanobis distance):更简单的马氏距离进行有放回且允许
并列的k近邻匹配。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 46
6. 倾向得分匹配

n 第一步、选择合适的匹配变量集:匹配变量通常应该对自变量和
因变量都有影响。
n 第二步、确定选择性的存在:确定解释变量不是随机的。
n 第三步、计算倾向得分:基于选定的匹配变量集,通过probit/logit模
型计算个体进入实验组的概率(倾向得分PS)。
n 第四步、进行匹配:采用某种匹配方法选出控制组。
n 第五步、匹配效果的检验:
q 共同支撑假设:匹配后,实验组和控制组的PS分布形态基本一致。
q 平衡性假设:匹配后,实验组和控制组在各匹配变量上已无显著差异,
即各匹配变量对Y的差异已不再具有解释力。
n 第六步、计算处理效应:对比实验组和控制组,计算平均处理效应
(Average Treatment effect on Treated, ATT),再做t检验看差异显著性。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 47
6. 倾向得分匹配-实例

n 史永东,王谨乐.中国机构投资者真的稳定市场了吗?经济研究
,2014,49(12):100-112.
n 研究问题:机构投资者能起到稳定市场的作用吗?
q Y:波动率、收益率、换手率
q 实验组:机构股
q 控制组:普通股
n 以证券投资基金作为机构投资者代表,以10%的基金持股比例
作为分组标准。
q 基金持股比例大于等于10%的股票定义为机构(重仓)股;
q 其余为普通股。
q 匹配:找到与被机构持有的股票(机构股)“相仿”的、
未被机构持有的股票(普通股)。
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 48
6. 倾向得分匹配-实例

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 49
6. 倾向得分匹配-实例

n 具体步骤
q 采用logit模型,对二元被解释变量(是否为机构股)进行回
归;
q 以各匹配变量的回归系数为权重,得到每只股票的倾向得分
(PS值),代表某只股票为机构股的概率大小;
q 采用“最近邻匹配”法,对机构股和普通股的PS值进行配对;
q 完成配对后的机构股和普通股在各匹配变量上已不存在显著
差别,剩下的唯一区别即为是否被机构持有(处理);
q 计算实验组(机构股)与控制组(匹配成功的普通股)在Y
上的平均组间差异ATT,并通过t检验看差异的显著性。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 50
6. 倾向得分匹配-实例

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 51
PSM使用中需要注意的问题

n 匹配变量数量的权衡
q 匹配变量越多,维度越高,越不容易找到相似的匹配对象;
q 匹配变量太少,又难以证明个体和匹配对象高度相似。
n 匹配效果的检验
q 共同支撑假设(common support)
q 平衡性假设(balance test)
n 常与双重差分法组合使用(PSM-DID)
n 局限性
q 通常需要较大的样本容量来实现高质量匹配;
q 要求立足于控制组的倾向得分有较大的共同取值范围,否则会丢失较多的
观测值,导致剩下的样本不具代表性;
q 只控制了可测变量的影响,如果存在依不可测变量选择(selection on
unobservables),仍会带来隐形偏差(hidden bias)。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 52
7. 事件研究

n Study the effect of an economic event on the


value of a firm.

n Events that affects a firm's valuation may be:


q 1) within the firm's control, e.g., the
announcement of a stock split.
q 2) outside the firm's control , e.g., a
macroeconomic announcement that will affect the
firm's future operations in some way.

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 53
7. 事件研究

n Events examples
q mergers and acquisitions
q earnings announcements
q IPO’s
q issues of new debt and equity
q dividend announcements
q stock splits
q announcements of macroeconomic variables
q tax reforms
q ……
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 54
7. 事件研究

n An underlying assumption
q The market processes information about the event in an efficient
and unbiased manner (EMH)
n Thus, we should be able to see the effect of the event (
因) on prices (果)

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 55
7. 事件研究

n Step 1: Define the event of interest


n Step 2: Identify the firms that should be
included in the study
n Step 3: Measure normal and abnormal returns
n Step 4: Choose an estimation window where
the model defining normal returns is estimated
n Step 5: Test whether the event has generated
abnormal returns
n Step 6: Empirical results and interpretation

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 56
7. 事件研究

n The time-line for a typical event study


�0 L1 �1 L2 �2 L3 �3

    �
Pre-event (estimation) Event Post-event (estimation)
window window window
q �: event date
q �0 to �1: pre-event (estimation) window, length L1
q �1 to �2: event window, length L2
q �2 to �3: post-event window, length L3
n There is often a gap between estimation and event periods.

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 57
7. 事件研究

n Choose a statistical model or an economic model as


the NORMAL returns. E.g.,
q Market-return model (most popular in practice)

��,� = �� + ����,� + ��,�

n Estimate model in estimation window


n Compute abnormal returns (AR) in event window
� ∗�,� = � �,� − �� − � � ∙ � �,�

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 58
7. 事件研究

n Compute cumulative abnormal returns (CAR), average


abnormal returns (AAR) and cumulative average abnormal
returns (CAAR)
q For firm i, aggregate computed abnormal returns over

time ∗
���� (�1 , �) = ��,�
�=�1
q At time t, average computed abnormal returns over N

firms ∗
1 ∗
���� = � � = ��,�

�=1
q Analyze simultaneously all the computed abnormal
returns by aggregating the over

time
����(�1 , �)  = � ∗�
�=�1 © 2023,覃筱
《学术写作、规范与伦理》,Copyrights 59
7. 事件研究-实例

n 徐泽林,高岭,林雨晨.买方机构调研与股价超额收益.系统工程理论与实
践, 2021, 41(10): 2457-2475.
n 研究问题:机构调研是否产生超额收益?
n 背景
q 《深圳证券交易所主板/中小企业板上市公司规范运作指引(2015年修订)
》,要求上市公司在投资者关系活动结束后两个交易日内,应编制《投资
者关系活动记录表》,并在深交所投资者关系“互动易”平台
(http://irm.cninfo.com.cn/)披露;
q 披露内容包括投资者关系活动参与人员、时间、地点以及交流内容。
n 事件(X):买方机构对上市公司的实地调研
n 结果(Y):CAR
n 样本:2012年7月1日至2018年12月31日,深市A股1571家上市公司
,20797次买方机构调研样本
《学术写作、规范与伦理》,Copyrights © 2023,覃筱 60
7. 事件研究-实例

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 61
Event study使用中需要注意的问题
考虑长期影响。

n Long-horizon Buy-and-Hold Abnormal Return (BHAR)


� �

�����,� = (1 + ��,� ) − (1 + �(��,� ))


�=1 �=1

n Econometric problems
q Misspecifications of expected returns: wrong inference due to
bias in the estimates of abnormal returns
q Non-random sample, leading to non-normal distributions: wrong
inference due to standard error calculations
n Parametric test

n Non-parametric test

n Bootstrapping

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 62
8. 结构参数估计

n 结构参数估计的一般步骤
q 建立理论模型,“treatment”在理论模型里是内生的(因此已经考虑
了内生性);
q 通过求解模型得到可以进行实证分析的公式;
q 用可观察到的数据对模型参数进行估计。

n 优点
q 可以进行量化分析;
q 可以做一些其他方法做不了的 “counterfactual” 分析。
n 缺点
q 对理论模型依赖性强,如果模型不合理,则估计出的参数和分析结
果都失去实际意义。

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 63
8. 结构参数估计-实例

n 支持
q Dynamic Models and Structural Estimation in
Corporate Finance, Ilya A. Strebulaev and Toni
Whited, Foundations and Trends in Finance, 2012.
q Dynamic Corporate Finance is Useful: A Comment on
Welch, Ilya A. Strebulaev and Toni Whited, Critical
Finance Review, 2013.
n 反对
q A Critique of Recent Quantitative and Deep-Structure
Modeling in Capital Structure Research and Beyond,
Ivo Welch, Critical Finance Review, July 2013.

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 64
Finance
-The End-
附录1:参考书(实证方法部分)

n Endogeneity in Empirical Corporate Finance,


Michael R. Roberts and Toni Whited, in
George Constantinides, Milton Harris, and
Rene Stulz, eds. Handbook of the Economics
of Finance Volume 2, 2012, Elsevier.

n Joshua Angrist and Jorn-Steffen Pischke


q 《基本无害的计量经济学:实证研究者指南》
q 《精通计量:从原因到结果的探寻之旅》

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 66
附录2:Codes and Packages

n Event Study
q https://www.eventstudytools.com

q https://cran.r-
project.org/web/packages/EventStudy/index.html

q https://dss.princeton.edu/online_help/stats_packa
ges/stata/eventstudy.html

《学术写作、规范与伦理》,Copyrights © 2023,覃筱 67

You might also like