劳动经济学的实验研究方法
闫威 陈长怀 韩美清 2010-03-23
摘要:在过去的几十年中,实验研究方法在经济学特别是劳动经济学领域中的应用呈稳步增加的态势。较之于其他实证研究方法,实验研究方法的优势主要在于能够对相关影响因素进行更为严格的控制,并能可靠地预测变量之间的因果关系,同时实验本身具有的可重复性也使研究结论更易于验证。目前学术界仍存在着一些反对实验研究方法的意见,如实验被试的选择偏差,被试所获得的支付水平的高低,观测的数目以及内、外部有效性等。 关键词:劳动经济学;实验研究方法;应用 Abstract:In the past few decades, experimental research methods showed a steady increase trend in economics, especially in the field of labor economics. Compared to other empirical research methods, the major advantages of experimental research method are the ability of more strictly controlling the related factors, reliable prediction of causal relationship between variables, and the easier research findings validation because of repeatability of the experiment itself. At present, there are still a number of academic research methods against the experimental observations, such as the selection bias of experimental subjects, the high or low of payment level obtained by subjects ,the number of observations, as well as internal and external validity. Key words:labor economics;experimental research methods;application 一、实验研究方法的优势 理论检验在科学进步中发挥着关键作用,研究者可以利用不同数据源实现对理论的检验。这些数据来源大致可按两个维度进行划分(Friedman and Sunder,1994):一是实际数据(happenstance data)和实验数据(experimental data);二是实地数据(field data)和实验室数据(laboratory data)。实际数据是未加控制的、自然发生的经济活动的副产品,而实验数据是在受控条件下,为了明确的科学目的而人为创造的。实地数据来源于自然环境,而实验室数据来源于实验室环境。这两种维度的数据可构成四种组合数据。 长期以来,经济学被看作是运用实地实际数据来进行研究的“非实验性”科学,如失业率、工资水平、教育年限和收入水平等均属于实地实际数据。既然实地实际数据如此丰富,为什么还要千方百计地进行实验并创造自己的数据呢,本文将从三个方面分析实验研究方法在劳动经济学研究领域的优势。 (一) 实验研究对相关影响因素的严格控制 锦标赛理论得名于体育比赛,是指员工通过竞争以获得某项奖励(如薪酬增加或晋升),胜出者由相对绩效排序决定。在锦标赛理论中,员工的均衡努力水平被定义为边际努力成本等于边际收益时的努力水平。边际收益取决于奖金数额以及获胜的机率,并与后者呈负相关关系(Lazear and Rosen,1981),给定均衡努力的选择就可以直接导出最优奖励的水平和结构。现以锦标赛理论的检验阐释实验研究具有可控制性的潜在优势。 若对锦标赛理论进行直接的实证检验,首先要求研究者知道参与竞争的员工数目,奖励的确切大小,员工努力的成本函数,以及生产函数(包括误差项的性质)。同时,为了确定最优奖励水平,还需要了解企业的支付函数与员工的参与约束。所有这些信息在实验室实验中都是确定的,研究者可以清楚地予以设定。通过观察实验被试所选择的努力水平和获奖情况,就有可能对最优报酬作出精确地预测并进行检验,而采用实地实际数据对锦标赛理论进行直接检验几乎是不可能的。因为当使用实地数据时,研究者很少能确切地知道以上提及的各种因素;而且研究者也很难保证实地环境与理论假设的环境高度相似。例如在锦标赛理论中,一个显而易见的事实是,如果员工在竞赛中有消极的破坏竞争对手绩效表现的行为,努力与奖励的最优水平同不存在破坏行为情况下的结果将是大相径庭的。 相同的道理,使用实地数据的研究者很少能知道员工与企业之间的互动是一次博弈还是重复博弈,然而重复博弈的理论预测往往明显不同于一次博弈的结论。还有其他一些重要因素,如员工彼此之间了解程度如何?员工之间的沟通及同伴压力怎样,有无形成共谋的可能?员工之间的互动方式是公开还是匿名?在实地实验中,以上因素及其他环境细节都会影响研究对象的行为,却不能被有效控制。与之相反,在实验室实验中,这些环境因素能够被严格控制,因此能够进行系统的研究。例如,在实验室实验中,对一次博弈与重复博弈情形进行比较研究,或者对匿名互动与“面对面”互动关系进行比较研究,将是非常方便的。 当然,这种能对影响因素进行更好地控制的优势不局限于锦标赛理论的研究。例如,在关于不同行业间工资差异的争论中,很难判断所观察到的差异是反映出的真实“租金”,还是不可观察的异方差性 (Gibbons and Katz,1992)。同样地,几乎不可能依据实地数据来判断失业是自愿的还是非自愿的,即很难判断失业员工在低于现行工资的情况下是否真的愿意继续工作。然而,在劳动力市场中采用实验室实验研究,控制员工的外部选择,则能对上述问题轻易作出回答(Fehr and Falk,1999)。以上例子极具说服力地表明,实验室研究较之于实地研究,能对相关影响因素实施更好的控制。 (二)实验研究能够推断变量之间的因果关系 实验室实验的另一个主要优势在于形成因果关系推论的可靠性。在实地研究中,许多有意义的变量是内生决定的,多数情况下最多也只能确认变量之间是相关的,而很难确认变量之间的因果关系。然而通过合理的实验设计,我们可以有把握地推断变量间的因果关系。实际上,实验研究是确认变量间因果关系的最有效手段。 (三) 实验研究的结论易于重复验证
实验研究具有易于复制的特征。传统的经验数据作为检验数据,具有不可重复性的缺陷,即所谓的“历史不能重演”。而对理论的证实或证伪都需要大量的检验。Smith(1962)指出,实验研究的可重复性克服了所有观察结论所普遍存在的一次性的缺陷。其他研究者可以很容易地复制实验设计,进行独立验证,从而证实或者证伪专题研究中得出的结论。实验数据的应用可避免某些理论没有经过一个可重复的严格证明或证伪的过程而被称之为所谓的“传教士的理论”。 二、实验研究方法的反对意见 首先,由于实验中的被试常常为学生,实验研究常被批评存在被试选择偏差,批评者认为学生对所要研究的问题缺乏实践经验。其次,主要针对实验中的支付(payoff)问题,由于一般情况下被试在实验中获得的支付较低①,他们可能不会以严肃认真的态度进行决策。第三种批评主要针对被试数目太少的问题,实验研究结论往往受到置疑。第四种批评主要来自于实验研究结论能否推而广之,对现实是否具有预测和指导作用,即实验研究的外部有效性问题。尽管这些批评有一定的合理性,但是不具有根本性的意义,因为通过细致周详的实验设计,这些问题完全可以克服和解决。 (一) 被试选择偏差 研究者之所以选择学生作为被试,主要是出于方便性的考虑。学生容易招募,能够迅速理解实验规则,而且他们的机会成本相当低。但是,并没有根本的理由来排斥其他对象,而且非学生被试的使用也在逐渐增加。其次,通过细致周详的实验设计和与实施,有可能发现不同被试样本在行为上的有趣差异。List(2003)对市场经验是否能消除禀赋效应问题进行了研究。Cooper et al(1999)利用中国学生和中国中层经理作为实验被试,检验了起源于效率工资激励的棘轮效应理论。同样地Fehr and List (2003)以企业CEO作为实验被试,研究他们使用显性激励方式的程度以及如何对这种激励作出反应。 List(2003)的研究结果表明缺乏市场经验的经纪人表现出了禀赋效应,而在拥有市场经验的经纪人身上却没有发现这种效应。拥有市场经验的经纪人之所以没有体现出禀赋效应,不是由于选择效应,而是由于市场经验本身。Cooper et al (1999)在实验研究中观察到,经理和学生的行为在很大程度上收敛于混同均衡。因此,被试样本之间的行为差异随着时间的推移而消失。在实验的初期,他们观察到不同样本之间的确存在一些差异。但是,如果实验指导语用一种抽象的、无关经理决策的具体环境的语言来描述,那么学生的行为较之于经理将更快地收敛于均衡点。相反,如果实验指导书中含有大量的与企业计划者和经理间的相互作用相关的内容,那么,经理的行为将更快地收敛于均衡点。Fehr and List(2003)发现学生和CEO之间的确存在行为差异,CEO明显比学生更信任他人,而且也更值得他人信任。虽然如此,两个被试样本仍然作出了使用显性激励方式的相同选择,尽管该方式有很大的负面影响。 这些例子均表明,被试样本差异可能是一个现实问题。但是,这些研究也显示出了不同的被试样本在行为上并没有表现出根本性的不同。在Cooper et al(1999)的研究中,学生和经理们的行为在经过一段时间后是高度相似的。同样,在Fehr and List(2003)的研究中,根据理论推断,如果假定所有实验的参与者是完全自利的,信任行为则不会存在,但作为被试的学生和经理们都表现出了非常强的信任行为。此外,两类被试样本都显示出大量利他的、互惠式公平的行为。因此,虽然存在某种程度上的被试样本选择偏差,但是不同样本的行为从本质上来说却是非常相似的。 (二) 被试所获支付较低 被试在实验中所获得的支付水平(stake level)较低也是一个非常重要的问题,研究者一致认为更高的支付水平能显著地降低被试行为的方差(Camerer and Hogarth,1999)。这就表明当被试在实验中能获得更高的利益时,他们会以更加认真的态度参与实验。但是Camerer and Hogarth(1999)在回顾了大量检验支付大小效应的研究后发现,核心的行为趋势极少因为支付水平的变化而改变。尽管支付(利益)对于实验被试而言是重要的,但是,利益大小的变化往往不会改变核心行为趋势。一个有趣且重要的例外出现在Holt and Laury(2002)的研究彩票选择实验中,随着平均支付从70美元增加到230美元,实验被试表现出明显增强的风险厌恶型特征。相反,在公平偏好实验中,支付水平的增加很少或者不会影响公平行为反应的发生。 (三) 被试样本量太少 关于实验被试样本数量较实际数据过少的问题也是能够克服的。首先,增加或补充实验的观测数目是可能的;其次,以国家宏观经济中的代表性问题为对象进行大规模的实验研究也已成为可能。近来,Harrison ,Lau and Williams(2002)采用丹麦人口总体的一个典型样本,推导出了贴现率;而Bellemare and Krger(2003) 则以荷兰为样本,进行了信任博弈的实验。其研究结论显示并不存在被试选择偏差。 (四)外部有效性问题 对实验室实验更为普遍的批评涉及到内、外部有效性问题,内部有效性指从某一实验中获得可靠性的原因和结论的可能性,而外部有效性是指从试验研究的外部环境联系中归纳出可靠结论的可能性。内部有效性涉及到的只是一个合适的实验控制、敏感度设计及正确的数据分析问题,相对而言,外部有效性的问题则更为严重。批评者认为把实验室的研究结论推广到实地中去,其可能性是非常值得怀疑的。 外部有效性主要涉及两个问题。第一,从一般意义上说,当归纳法原理成立时,外部有效性将会是较高的。根据这个原理,只要绝大部分相关的潜在条件保持不变,那么,行为规则在新环境中也会持续不变。存在这样一个事实,即便保持所有条件不变,也难以保证实验结果在现实环境中可以被完全复制。虽然这个说法是正确的,但是这种批评也不是仅仅针对实验研究。事实上,没有任何实证研究能够确保在同样的条件下复制出完全相同的结果。第二,实验研究是否抓住了现实中的主要条件。置疑者认为某些实验因为忽略了现实中的许多关键性特征,从而不具有外部有效性,也就不符合实际情况。实验研究者的回答往往是尽可能模拟出这些被忽略的条件。但是,从某种意义上来说,实验研究和经济学模型一样都是不太现实的,因为它们都是对现实的高度抽象,这种抽象也正是一种优点,惟其如此才能够使人们增加对相关变量之间相互作用机制的理解。由于对现实性的强调实际上取决于实验的目的,在很多情况下实验研究的目的就是为了检验理论,或者理解理论失灵的原因。因此,实验证据对理论构建非常重要,但是对理解现实却不那么重要。 三、增加实验研究现实性的途径 (一)实地实验 无庸置疑,实验的可控性是其主要优势。然而关于实验室环境和现实生活环境是否一致的问题,可能将备受争议。可以说实验室实验不是对传统的实证经济分析方法的替代,而是对其的有益补充。将二者有机结合的方法之一就是进行实地实验,让研究者在自然的环境中研究经济主体的行为。Falk and Ichino(2003)进行了一个典型的实地实验——将实验控制和现实环境的优点结合起来,研究同伴压力对工作行为的影响。实验是在日常工作环境中进行的,被试被分为处理组和控制组,其产出被分别测量。在处理组中,两个被试在相同的房间中一起工作;而在控制组中,每个被试分别在一个房间内单独工作。从技术上来讲,实验被试所从事的任务彼此完全独立。研究结论之一显示,与被试单独工作情形下的产出相比,随机选择的配对被试工作时的产出有了显著的增加。在另一个实地实验中,Fehr and Gtte(2002)研究了一个企业中员工的工作时间和努力的跨期替代问题。在某一段时期内,他们对公司的一半员工按照更高的计件工资给付薪酬,而对公司的另一半员工按照固定的计件工资支付。采用这种方式,他们创造一个控制组和一个处理组,用以测量计件工资的增加对劳动力供给的影响程度。
(二)“真实努力”实验 使实验室实验环境更贴近现实的另一个途径是进行所谓的“真实努力”实验。在一个典型的实验室实验中,工作努力的选择由一个递增的货币函数来表示,被试不是选择真实的努力水平,而是选择一个有经济意义的数字。这种方法被广泛应用于锦标赛实验中(Bull et al.,1987)和效率工资实验中(Fehr and Falk,1999)。然而在“真实努力”实验中,努力代表的是完成一种真实的任务。例如,在Fahr and Irlenbusch(2000)的研究中,实验被试的任务是剥胡桃;van Dijk,Sonnemans and van Winden(2001)要求实验被试利用计算机解决难度较大的双变量优化问题;在Gneezy(2003)的研究中,实验被试需在计算机上解决“迷宫”难题。“真实努力”确实能够增强实验的现实性,然而需要指出的是,这是以失去可控性为代价的——因为如果实验者不了解员工的努力成本,那么也就不可能得出准确的数量预测。 (三)项目评价实验 实验技术在项目评价领域也具有很高的价值。不幸的是,基本上不能够获得来自随机的大规模社会项目实验的数据,尤其是在欧洲,政策制定者对实施这样的社会实验往往持着犹豫不决的态度。尽管如此,研究者自己收集数据也是可能的。例如,Falk et al(2002)提出了一个新颖的项目评价方法,它允许在弱假设条件下确认参加培训项目与被邀请参加面试的可能性之间是否存在因果关系。基本思想是通过在较短的时间间隔内对参与项目的同一个体实施前测和后测,以此对项目进行评价。其程序如下:首先,研究者招募一些失业者参与一个特定的培训项目,然后在这些人完成培训课程之前,向外投递求职申请书。当这些人已经成功完成培训课程并获得证书后,又发出第二次求职申请。两次求职申请内容完全一样,只是第二次多了一个课程证书而已。由此可以检验参加培训项目对获邀参加面试的概率是否有影响。相似的方法已经应用于对女性员工的歧视(Weichselbaumer,即出)和失业粘性的(OberholzerGee,2000)的研究。 四、展望 过去的20多年,经济学领域的实验研究获得了突飞猛进的发展,其应用也呈现出稳步增加的态势,这种增加的趋势将持续下去。事实上,2002年诺贝尔经济学奖授予Daniel Kahneman和Vernon Smith,可能使实验经济学家们获得更广阔的舞台。实验研究方法在诸多经济学领域都大有用武之地,其中很多领域都与劳动经济学相关。值得注意的是,经济理论与实验方法不可偏废,二者各有所长,相得益彰。经济理论使我们能够在制度或者参数族(如税率)的框架下对经济行为作出合理的预测,而实验方法能够为不同制度环境的运行效果提供经验证据,从而对经济理论进行检验。此外,在实验过程中对于人类行为的观察,也将促使研究者更严肃地对待个体动机和有限理性问题。从长期来看,这有助于我们对人的本性进行更现实的刻画。实验研究已经成功地应用于公平、互惠、损失规避、过分自信、非指数贴现等现实经济社会现象,通过研究它们对激励和契约的影响,对组织设计的影响,以及对劳动力供给和需求的影响,可以大大增进对企业、家庭与劳动力市场运行机制的理解。 注释: ① 一般而言,研究者为了模拟出真实的市场环境,往往为被试在实验中的绩效表现支付一些数额不大的报酬,以增强所研究问题的现实相关性,提高被试的认真程度,并以此确保实验研究的信度和效度。