北京中医皮肤病医院 http://pf.39.net/bdfyy/bdfjc/160306/4781522.html
本文来源于:计量经济学
Source:上财金融学院。工具变量法是为了缓解内生性问题而经常使用的一种方法。但工具变量的有效性与使用过程中的谨慎性一直是学术界关心的问题。年,JournalofAccountingandEconomics曾发表一篇题为OntheUseofInstrumentalVariablesinAccountingResearch的论文。该文发现-年JAR、JAE和TAR三大会计顶级期刊共有42篇论文使用了工具变量。基于这些文章,该文识别了工具变量法优于OLS估计的适用条件以及使用工具变量需要做的一系列检验。七年之后的今天,国际著名金融学家、曾RFS主编(金融学里的三大TOP期刊之一,这是非常牛掰的存在)、哥伦比亚大学商学院讲席教授姜纬(WeiJiang)教授推出新作:HaveInstrumentalVariablesBroughtUsClosertotheTruth?该文对JF、JFE和RFS三大金融顶级期刊中篇运用工具变量进行回归估计的论文进行研究后发现,工具变量估计法将回归估计系数平均扩大了九倍。针对该项“难以置信”的扩大效应,姜纬教授在论文中做了相关解释,同时也为运用工具变量估计方法做因果推断的学者提供了宝贵建议。我们将该篇的核心观点摘录于下,文章全文请见ReviewofCorporateFinancialStudies。现象:工具变量增大了估计参数至年间,发表于国际三大金融顶级期刊(JF、JFE、RFS)的论文中,有篇运用了工具变量法(如下图)。相比于OLS回归,工具变量的运用使得估计参数平均扩大了九倍。姜纬教授将内生性问题根据OLS回归系数偏差的方向分为了三大类:正向性内生问题、矫正性内生问题、不确定性内生问题。篇文章中67.1%的文章存在正向性内生问题,在这类研究中,运用OLS回归分析时所估计的系数会高估总体平均处理效应(populationaveragetreatementeffect)。理论上,在存在正向性内生问题的研究中,我们预期IV回归系数应该要小于OLS回归系数。但姜纬教授发现,在这类情况下,仍然有79.8%的研究在运用工具变量法缓解内生性问题后,其结果反而扩大了其估计系数。那这是什么原因呢?
原因:局部平均处理效应、弱工具变量及发文有偏
针对工具变量回归估计所带来的“难以置信”的扩大效应,姜纬教授从以下三大方面找寻了原因。首先,“局部平均处理效应”(LATE)有可能会使工具变量法估计的系数被扩大。“局部平均处理效应”是由异质性产生,即每个个体的处理效应(treatmenteffect)是不同的。在这种情况下,工具变量的采用有可能造成只衡量了处理组一部分个体的平均处理效应,而非处理组的平均处理效应。姜纬教授在文中举了一个劳动经济学的经典问题来说明局部平均处理效应对IV结果的影响。以往的研究中,学者发现教育对收入的影响研究面临很大的内生性问题。比如,能力强的人更有可能接受更高层次的教育,而这部分人也更有能力获得更高的报酬。在此类研究中,“是否居住在大学周围”确实是一个不错的工具变量,因为考虑教育成本等因素,距离学校的远近会影响是否接受大学教育的选择,但这又和一个人的能力、天赋没有很大的相关性。但是,距离学校的远近只会影响上大学的个体中对教育成本敏感的个体的抉择;对于那些无论如何都会去上大学的个体来讲,距离学校多远多近都不会改变他们的抉择。这就是典型的局部平均处理效应。在这种情况下,教育成本敏感个体的教育回报可能会远远大于无论就近是否有学校都不会去上大学个体/会去上大学个体的教育回报。因此,在计量上这类局部平均处理效应会造成IV的估计系数比OLS的估计系数大。其次,弱工具变量也可能使得工具变量估计系数放大。如姜纬教授文中所述,运用工具变量估计的系数与真实系数之间存在一定的区别。当外生性条件无法得到完全满足时,工具变量估计系数与真实系数之间的差值同时取决于工具变量的外生性和相关性。当工具变量为弱工具变量,即相关性很小时,会放大排除性限制(exclusionrestriction)对于系数估计的影响,进而使得IV的估计系数比OLS的估计系数大。第三,发文导向也可能导致已发表的论文中工具变量估计系数普遍偏大。一般来讲,关键变量的估计系数如若不显著则论文很难发表。使用工具变量会使样本估计方差变大,在这样的情况下,论文作者通常会偏爱于估计系数值更大的工具变量以保证估计系数显著。这也就是为什么我们在已经发表的论文中会看到工具变量法的估计系数远大于OLS估计系数。建议:这样看来,工具变量也许并没有让我们更加接近事实。针对这一问题,姜纬教授对研究者们提出了如下几点建议。首先,研究者应该对内生性问题进行更详尽的分析。比如内生性问题的大小以及会如何影响估计系数(正向或是负向)。姜纬教授建议研究者可以通过样本分组的方式来进行分析,对不同子样本的回归结果进行分析可以有助于找出内生性问题对原有估计的影响机制与效果。同时,当工具变量估计出现令人难以置信的结果时,研究者需要谨慎分析其中的原因。其次,研究者应该正视工具变量的效能。如前所述,如果是弱工具变量,即使通过了弱相关检验,其估计系数也会偏离其真实系数,这是研究者需要时刻谨记的。最后,研究者应该结合事实来做分析推断。举个例子,关于双层股权与掏空的研究,如果运用工具变量法研究发现大股东与管理层利用此股权结构进行掏空并损害了5%的公司价值,那这并不稀奇。但是,当你的研究结果发现他们损害了50%甚至%的公司价值时,那就必须警惕了。这无疑也需要你再次分析其中的原因,从而进一步接近事实真相。拓展阅读在不借助工具变量、断点回归和随机冲击的前提下如何完成有意义的推断首先,姜纬老师先从红酒和健康的例子出发,引出本场报告的主题。她提到简单回归发现,每天喝红酒的人身体更健康一些,从这个事实中我们可以得出什么结论?能否得出因为喝红酒所以身体更健康的结论?有人回答,不能。姜教授追问:从这个回归中,我们能够得到什么结论呢?观众积极响应:有人说有可能是因为健康的人喜欢喝红酒。“很好,”姜纬老师说,“这是一个反向的因果推断。”姜老师进一步解释:从回归结果中,我们仅仅知道喝红酒和健康状况存在显著的相关性,但是回归本身不能告诉我们两者之间是否存在因果关系。而建立因果关系是科研的重要意义所在。那么我们应该怎么做呢?通常应该借助工具变量,借助断点回归或者寻找随机冲击,来解决其中的内生问题。但是如果找不到这些工具,我们能不能完成一些有意义的学术研究呢?姜老师的讲座从六个方面阐述了如何不借助这些手段和技巧来进行一流的实证研究。(一)处理效应并不是唯一有趣的经济学问题平均处理效应(averagetreatmenteffect,ATE)是当前经济/金融研究中最受推崇的推断方法。但由于条件苛刻,在大多数情况下并不能实现,使得ATE并不能发挥作用。但是我们可以通过选择效应(selectioneffect)来帮助我们达成目的。例如在Jiang,Nelson,andVytlacil(,RFS)的研究中,使用某个主要的全国性的住房抵押贷款银行的数据,研究了证券化与贷款业绩表现之间的关系。以往的研究发现筛选努力与事前的贷款销售概率之间存在负相关性。与此不同,这篇论文发现从事后而言,银行资产负债表上留存的贷款比出售的贷款有更高的不良比率。这似乎和我们的直觉相反。为什么会得到这样的结果呢?这篇论文明确区分贷款业绩与贷款出售之间的事前事后关系。事前关系是银行在决定是否发起贷款时所认为的关系,事后关系适用于贷款发起和出售期间的关系。事前事后产生了相反的结论,主要是因为投资者存在选择效应,只有质量好的贷款才能在二级市场出售,因而导致了如此关系。另一个例子是来自MulliganandRubinstein(,QJE)的关于“女性相对工资”研究,该项研究发现,年到年,性别间的平等程度变化线(用女性工资中位数除以男性工资中位数来表示)与性别内的不平等程度变化线(用90分位的男性工资除以10分位的男性工资表示)趋势是一致的。为什么会产生这种现象呢,这是因为选择效应的存在,当女性逐步进入劳动力市场时,只有聪明的女性在与男性的竞争中能够在劳动力市场上留下来,数据不能观测到未参与工作的女性,因而导致了这个现象的存在。(二)配对固定效应什么是固定效应,固定效应有什么好处呢?在大多数面板数据中,固定效应都可以吸收大部分随时间不变的内生性,但并不能处理随时间变化的内生性。固定效应在处理内生性匹配层面表现除了相当强大的力量,但是需要提前分类数据。在Jiang,Wan,andZhao(,RFS)的研究中,当董事会组成和会议议程都是内生的时候,可以对董事会的分歧做出解释吗?除非个体的投票数据是可以采用的,然后内生性匹配就可以通过固定效应被吸收掉。多维的固定效应可以作为控制变量完备集合的替代。有的研究甚至只有一个回归元,例如Fisman,Paravisini,andVig(,AER),文章的表四只包含了一个“SameGroup”回归元,通过使用的是来自印度银行的办公人员和借款人的宗教、种族的二元匹配数据,借此来表明,贷款人和借款人之间的文化接近度(共同的守则、信仰和种族等)增加了信贷的数量,并减少了还款违约。如果不平衡集群的原因和内生性有关,那么固定效应可能会失效,这时候可以通过寻找一个共同的比较对象来解决。比如说,现在要选择一个学生,有两个对象可供选择,都是财大的,一个来自经济学院,GPA为3.6;另一个是金融学院,GPA为3.7,给定这些信息我应该怎么选,有同学愿意回答一下吗?似乎没法选,因为两个同学来自不同的群体,GPA的直接比较不再具有参考性。但假设两个同学之间有一个可以共同比较的同学,是不是这两个同学就建立了间接的关系?在Brav,Jiang,Li(;earlystage)关于投票代理权角逐中对冲基金与机构投资者的关系研究中就作出了这样的处理。研究发现,基金并不会在所有的代理权争夺事件中投出自己的一票;Pro-Activist衡量方法在不同事件中没有可比性;任何两只基金都可以在他们参与投票的代理权争夺事件的基础上进行比较;基金的相对排名可以通过两两比较的方法进行分类。(三)从预先确定的敞口中进行识别在法律或政策变化方面的双重差分(DID)分析很常见,然而法律或政策变化几乎不是随机的。预先确定的政策敞口变化可能是一个挽救办法。一方面可以借助与政策变化合规程度(Distanceto