用于政策评估的计量经济学:问题、前沿与展望
2019年08月28日 09:33 来源:《中国社会科学报》2019年8月28日第1766期 作者:周亚虹 张征宇

  我国正处于改革攻坚阶段和发展关键时期。在努力实现经济增长方式转变与产业结构优化的过程中,一项重要的任务是对国家与地方出台的各项政策,特别是经济政策予以正确评估,以便发现问题、总结经验,对政策适时微调,为制定新政策与配套措施提供借鉴。政策评估计量经济学(econometrics of policy evaluation)是现代计量经济学的前沿分支之一,它将自然试验的思想与结构模型相结合,通过发展识别估计各种因果效应的统计推断方法,为科学评估政策的有效性与利弊得失提供方法论支持。

  经济系统的高度复杂性、有限理性个体的自选择行为以及可获得数据的局限性,使得评价一项政策或一次重大事件的影响并不像看起来那样容易。利用大容量的微观数据评估一项政策的难点主要在于以下三方面。

  第一,数据缺失问题。假设政府准备实施一项旨在鼓励企业通过技术升级提升生产率的政策。假如可以同时观测到同一家企业在该政策实施前的生产率Y0以及政策实施后的生产率Y1,那么二者之差无疑度量了政策对该企业的净效应。但是,现实中我们一般只能观测到个体在已实现状态下的结果,即Y=DY1+(1-DY0),其中D=1表示个体参与了政策,D=0表示个体未参与政策。这意味着无法识别单个企业的政策效应。以上问题被称为政策评估的根本问题。为了克服它,经济学家需要在一定假设下,利用已知数据预测个体在未知处理状态下出现的反事实结果。

  第二,混杂因素(confounder)的干扰问题。在政策评估的许多问题中,简单地将事件发生前后的结果做差分,得到的估计量往往同时混合了政策效应之外其他干扰因素的影响。例如,需要评估国家某一重大经济刺激政策对某一地区GDP的拉动作用。简单地将该地区在政策实施前后的GDP相减后得到的数值,至少混合了以下三个因素的作用:一是该重大经济刺激政策对GDP的作用;二是与该重大政策同时发生的,其他中小规模政策对经济的影响;三是即使没有任何经济政策,该地区自然的经济增长。为了从各种混杂因素中剥离出所要研究政策的净效应,计量经济学常用的方法是倾向得分匹配法(propensity score matching, PSM)以及双重差分法(difference in differences, DID)。

  第三,不可观察的个体异质性。这是微观数据的基本特性之一。在政策评估中,不可观察异质性主要带来两方面的问题。首先,个人在决定是否参与政策时,不可观察的个人偏好以及对政策后果的理性预期与结果方程中的扰动项产生相关,导致政策不再是一场真正意义上的自然试验,因而具有内生性。这种由不可观测变量导致的内生性无法由PSM加以消除,经常需要工具变量的介入。这为识别与估计政策效应带来了难度。其次,越来越多的经济学家发现,即使控制了所有观测变量,政策对个体的影响依然因人而异。近年来,计量经济学家开始转向对政策分布/分位数处理效应的识别与估计,这一趋势体现了对政策评估中不可观察异质性的关注与重视。

  数据缺失等问题导致政策效应一般不能在个体层面得到识别。常用的度量政策效应的参数包括平均处理效应(average treatment effect, ATE),它是个体处理效应在整个人群上的期望值,反映了政策效应对所有人的平均值。除此以外,还有处理组平均效应(average treatment effect on the treated, ATET),它是个体处理效应在处理组人群上的期望,反映了政策效应在受到政策影响那部分个体中的平均值。无论ATE还是ATET,它们的共同特点是用单一参数简洁刻画政策对某个感兴趣群体的平均效应。

  近年来,研究者在利用处理效应模型评估经济政策时,越来越重视分析政策的分位数处理效应(quantile treatment effect, QTE)与分布处理效应(distributional treatment effect, DTE),而不仅仅着眼于ATE。出现这种趋势,一方面是因为政策对因变量分布尾端人群的影响程度往往不同于对因变量分布中段人群的影响;另一方面,众多有关社会福利、平等性问题的回答都有赖于研究者了解政策效应在整个受众人群中的分布情况。以中国在1999年起实行的大学扩招政策为例。在短短几年内,中国的高等教育迅速由精英教育过渡到大众教育时代。目前中国高等教育毛入学率达到40%,普通高等院校年招生规模突破700万大关,居世界第一。长久以来,对高等教育扩张的讨论焦点之一就是扩招政策是否真的有助于减少收入不平等,增进社会公平。如果只估计由大学扩招引起的教育回报率变化的ATE,那么充其量只能了解到这一政策提升了人们的平均工资,但是难以知道政策如何影响不同时期人们的工资分布,从而无法回答有关收入不平等方面的问题。为了回答有关收入不平等的问题,可以通过估计在扩招政策实施不同时期的QTE/DTE,帮助理解政策带来的异质性影响。

  利用PSM识别政策效应依赖于较强的条件外生性假设。条件外生性是指当控制了一组可观测的变量X后,D和(Y1,Y0)互相独立的情形。在实际中,个体在决定D的取值时,其决策过程依赖于一些研究者无法观测到的,包括个人能力、禀赋和风险偏好等因素。同时这些因素反过来影响(Y1,Y0)。例如,在研究接受高等教育对个人工资提升作用的过程中,D=1表示读了大学,D=0表示未读大学。不可观察的个人能力通过学习成绩来决定这个人是否能够考进大学。与此同时,个人能力也与其在劳动力市场的表现密切相关。在这种情况下,即使控制了可观测的个体特征,D和(Y1,Y0)仍然相关。此时需要工具变量的介入才能一致地估计出读大学对工资的净效应。

  当某一政策实施以后,尽管可以同时观察到处理组中政策前后的变化,但这个变化同时包含了政策的处理效应和不可观测的时间趋势的变化。如果假设时间趋势在处理组和对照组的变化是相同的,那么可以采取两次差分的方式,将共同的时间趋势剔除出去,从而得到平均处理效应的估计值。这就是DID方法的思想。DID的主要优势在于计算简便,可以接受某种形式的选择性误差,但主要问题在于,处理组和对照组之间必须保持相同时间趋势的假设有时不符合现实,且较难检验。

  当是否接受政策影响的概率成为一个非连续函数时,断点回归(regression discontinuity design, RDD)成为近年来非常热门的估计“准实验”政策处理效应的方法。当选择变量与是否接受处理效应的关系是确定时,经济学家通常使用精确断点回归(sharp RDD)。当选择变量与是否接受处理效应存在随机关系时,即是否接受处理效应的同时受到一些不可观测的选择变量影响时,通常使用模糊断点回归(fuzzy RDD),这是一个类似于两步法处理工具变量的估计方法。

  近几年来,微观计量经济学在政策评估方面取得较快发展。由于大数据时代的来临,这一领域也面临更多的发展机遇与挑战。大数据背景下的政策评估计量经济学不仅符合经济学术发展的前沿,而且能够满足国家发展的重大需求。大致来看,该领域未来的发展方向可能包括以下几个方面。

  第一,诺贝尔经济学奖获得者詹姆斯·赫克曼(James Heckman),同时也是政策评估计量经济学发展的领军人物,曾明确提出政策干预的微观计量评估的三大任务:一是评估已实施政策的效应;二是预测已实施政策在新环境、新人群中将要产生的效应;三是预测尚未实施的新政策在新的环境中将要产生的效应。现有关于政策评估的大部分研究只关注第一点。鉴于政策制定者经常需要在实践中发现问题、总结经验、对政策做出及时微调,并制定新的政策与相关配套措施,上述第二、三项任务将是未来该领域的重点发展方向之一。

  第二,更加注重对异质性政策效应的识别、估计和推断。已有能够反映政策效应异质性的参数包括分位数处理效应与分布处理效应。实际上,分位数处理效应还可以分成条件分位数处理效应与无条件分位数处理效应,两者在名称上接近,但是识别与估计的步骤相去甚远。另外,尽管DID方法已经成为政策评估的常用方法之一,但是用此方法的研究基本上只关注ATE类型参数的识别和估计。如何在DID模型中反映出政策异质性效应并加以识别,将是一个值得研究的问题。

  第三,目前大部分处理效应模型呈现出以下特点:只适用于单截面数据,或者两期数据(例如DID);政策变量多为0/1取值变量。将已有结果拓展到利用多期面板数据进行政策评估、连续取值的政策变量的评估,以及动态处理效应模型将是未来可以研究的方向。动态处理效应模型是指一个政策分两阶段实施,人们可以在第二阶段开始前根据第一阶段实现的结果自由选择是否继续参与下一阶段的政策,此时第一阶段的结果将会影响个人是否参与第二阶段的决策。

  (作者单位:上海财经大学经济学院)

责任编辑:张月英
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026