第30章 霍桑效应
《如何独立思考》章节:第30章 霍桑效应,去读读网友提供全文无弹窗免费在线阅读。!
所属部分:警世故事
引申话题:观察者效应
霍桑效应(the Hawthorne effect)又称为观察者效应,指的是对某人的观察会让被观察者改变其自身的行为,而这种人为的现象会导致错误的研究结论。
我们每个人都会察言观色。但是对针对人类的研究实验来说,这种行为常常会对实验结果造成干扰。
——史蒂芬·德雷珀
霍桑效应(即观察者会对被观察对象的行为造成影响)是一个相当复杂的现象。我们常常说“事情比你想象的要复杂”,这已经成为科学研究过程中的一条基本原则。霍桑效应就很好地说明了这一点。这20年来我一直致力于传播科学理念,而如果要说其中我还有所收获,那就是知道了这一原则。人们普遍偏爱“过度简化”,但这其实(在某种程度上)是一种适应性行为。宇宙是如此广袤,世界是如此复杂。搞清楚这世上每一样事物的每一个微小细节可能是一件徒劳无功的事情。我们对世间万物的理解往往是经过“净化”的信息——只要和实际情况差不多就行了(不管我们是否真的知道,或者我们是否愿意去了解)。
这些经过简化的信息也有其用武之地,只要你意识到它们只是对现实的近似描画,而不是对现实的完整描述。我们把专业知识划分为不同层次,而这种划分其实在某种程度上反映了人们解释事实时所用模型的复杂程度。在面对不同等级的复杂事物时,我们出于不同目的会选择复杂程度不同的模型——这也是个很有趣的现象。那么,我们需要了解到何种复杂程度的信息才足够呢?针对这个问题,我会在下文给出自己的答案——这是我深思熟虑后的结果,而且我认为它是可行的。
霍桑效应
我们可以将霍桑效应简述如下:对被观察者的行为进行观察会对该行为造成影响。这是一个内涵广泛的现象,而“聪明的汉斯”就是其中一类特例——观察者无意当中向被观察的对象传递了信息。1953年,心理学家约翰·弗兰奇首次使用了“霍桑效应”一词。该说法源于1924—1933年的一个实验,实验地点设在美国西部电气公司(Western Electric)位于芝加哥郊外的霍桑工厂。经过各种改变工作环境的尝试后(比如调整灯光的亮度),研究者发现,无论什么样的改变都能让生产效率有所提高。无论是把厂房灯光调亮还是调暗,结果都是如此。最终的研究结论是,人们的工作效率之所以有所提升,是因为他们知道有人在一旁观察,与工作环境变化没有任何关系。现在我们也称之为“观察者效应”。
对大多数人来说,上面这一段话言简意赅,而且包含了足够的信息。我们对霍桑效应了解到这个程度差不多也够了。实际上霍桑效应要复杂得多。从事科学理念传播的人往往不满足于这么一小段话,而是会补充许多细节,试图将它扩展成为一篇论文,把整个来龙去脉都如实地告诉读者——原本只有科学爱好者(对本书而言应该是拥有科学思维的科学怀疑论者)才需要了解到这个程度。这还没完——只要你愿意,你完全可以根据专业程度的不同需要,再进一步深入研究下去。关键是,无论深入到哪个程度都要保证基本正确。
问题在于,对于霍桑效应,人们平常接触到的那些一段话式的概念总结未必正确。为了让表达更加准确,有时我们需要补充一些细节,并对原有的说法做一些微调。优秀的科学“传教士”必须知道如何把握好这个度,这也是他们必备的专业素养之一。
好,现在让我们回到霍桑效应上来。关于霍桑效应,我曾经听到过不少自相矛盾的解释。为此我颇下了一番功夫,为的就是能解决这样的矛盾。我希望自己的解读能够基本准确,并且在细节上力求真实无误。我最近对公开出版的有关文献(从这里开始入手比较好)做了一次总体回顾和研究,以下就是2014年的研究成果及结论:
结果
共计19个精心设计的研究项目,其中包括处于控制条件下8组随机试验,5组准实验,以及6组针对受试者行为的观察评价(通过回答问题,或者直接观察并让被观察者知道其正是研究对象)。它们给出了关于霍桑效应强弱的量化数据。其中只有1组实验属于医疗健康领域,并且相互之间的研究方法、背景及成果有很大的差异。受评判对象本身的复杂性很可能导致结果出现较大偏差,但不管怎么说,多数实验结果多少还是证明了某种效应的存在。
结论
研究对受试者行为造成的影响的确存在,但无法确知其实验条件、作用机理及效应量级。该领域的实证研究亟须新的理论支持。
基于上述研究(包括其他研究)可知,20世纪的那些例证似乎能够证明一点:置于某社会背景(比如工作场所)下观察人的行为,会产生某种实验者效应。但它并非完全等同于观察者效应——观察者得知有人正受到观察后的一种反应。因此,所谓“霍桑效应”现在更多的是泛指实验者的人为影响。
霍桑实验当中的一些细节很有意思,同时也能帮助我们更好地了解这个实验。实验者花了整整5年时间,找了数千名工人作为实验对象,并观察他们对灯光亮度变化的反应。同时他们也安排了对照组,让后者始终在稳定的灯光环境下工作。总体而言,无论灯光亮度怎么调整,其结果都是工人的劳动效率有所提高。实验组和对照组的工作效率都有所改善,两者没有统计学上的差别(前提是灯光亮度不能对工作造成实质性的影响——如果灯光被调到很暗,以至于根本看不清周围的工作环境,工人们肯定不会乐意)。除了灯光,实验组还对工人们的休息时间做了调整,并对两次休息之间的时间长短也加以控制,也得到了同样的实验结果。假如缩减工人们每天的工作时间,每小时的生产效率同样会得到提升。当然了,工作时间不能太短,否则每日的生产效率还是会下降的。
通过其他实验,我们认为以上结论同样适用于别的领域。在一系列针对教学预期的实验中,教师被告知其中一组学生在能力测验中得分很高,因此很可能在课堂中表现出色。虽然一开始两组学生的表现不分伯仲,但两年后的跟踪结果表明,被赋予高期望值的这批学生课堂表现确实比另一组更加突出。此外,尽管另一组(低期望值)学生有时候也做得相当不错,甚至超过人们的预期,但教师依旧会对他们表示不满。
1900年,心理学家约瑟夫·贾斯特罗进行了一系列用穿孔卡片做的实验。其中一组美国人口普查局的员工被告知,他们每天需要在制表机上完成550张穿孔卡片。这一数量完全在他们的处理能力范围之内。但是当被要求完成更多卡片时,员工们纷纷表示为难。实验人员未向第二组人员透露任何信息,结果他们每天能够完成2 100张卡片的工作量。
如何解释这一切?
心理因素显然在其中发挥了作用,值得深入研究。但是如果把它完全归结为观察者效应,显然是把事情想得过于简单了。如果忽略了其他重要因素的影响,我们几乎可以认定上面的结论是错误的。其中一个因素就是人们的预期。在课堂教学及穿孔卡片的例子中,我们可以清楚地看到预期的作用。尽管我们还没有搞清楚内在的原理,但可以肯定的是,教师本身会对学生课堂表现施加相当大的影响。但是,这种影响会受到预期的干扰——这也解释了为何人们会高度关注教师的个人倾向性,比如,是否存在对学生性别和种族方面的歧视。这也是为什么我们必须非常小心给学生贴标签的行为,我们还要避免根据可能带了“有色眼镜”的标准化测试来看待学生。
在穿孔卡片的实验中,实验结果似乎受到了“自我预期”偏差的影响。假如能预先设定一个用于判断的值,人们会更容易确认某件事是否合理,或者其可能性有多大。如今人们把它视为“锚定启发式思维”的一个组成部分——我们可以事先设定预期值,接着对该预期值有一个预期判断,那么这个预先设定的值和判断就成为我们的参照标准。事先规定好工作份额就是预期设定的一个非常典型的例子。
近年来,人们更多关注的是这些效应对社会群体造成的影响。在一个群体中,人们的行为会受到工作文化的影响。但是,有许多因素可以反过来影响工作文化,预期设定就是其中之一。当你置身于别人的放大镜之下,或者感觉老板似乎很关注你的工作环境(或者你对此还有点发言权),这种情况也会对你的工作造成影响。楼上的那个家伙如果总是关注你办公环境的一些细节(比如灯光亮度什么的),这也会在很大程度上影响工作文化。在同一个工作环境中,人们也会互相影响对方。他们会默契地达成某种“行为规范”,以及对工作标准和工作效率的预期也基本一致。事实上,与管理层的预期相比,员工之间的相互预期对他们自身行为的影响更大,这是事实。
如今的企业管理非常仰仗咨询顾问的作用。咨询公司会派人进驻办公室,观察这家公司的工作文化,并根据管理理论或者他们自身的管理经验提出改进意见。如此折腾一番后,员工的工作效率几乎都会得到提升。可以想象,这个让企业“自我完善”的咨询行当其实卖的就是霍桑效应,哪怕他们提出的改进建议完全是凭空想象、不知所云,或者干脆有可能使效果适得其反。
霍桑效应与安慰剂效应非常类似。这两种效应都是多重复合效应,很难严格区分开其中的每一种效应。同样,这两种效应都会给人一种错觉——人们会以为这是针对某种特殊干预手段所产生的某种特定反应,但实际上它不过是一种针对任何干预与评估的非特定性反应。
自助产业(self-help industry)主要兜售的也是这两种效应。就好比一个正在节食的人,他的具体食谱其实无关紧要(和灯光强弱调节一样,前提是不要太过分地节食,以至于对生理功能造成损害)。他开始关注自己的饮食,并试图增大活动量,这些行为本身就产生了某种效应。
无论什么情形下,外界干预看上去至少都会产生一定的主观效果。各式各样的观察因素及心理因素都能让人们产生实质性的行为改变,当然也会让观察者在评估结果时产生偏差。因此,人们会经常错误地认为,既然某一种具体干预手段(一次治疗、一次节食、一项“自我完善”的计划等)都会起到独特的作用,因此这种做法背后的核心理念一定是正确的。
广义上的霍桑效应和安慰剂效应的影响极其深远。人们总喜欢问同一个问题:我们能把它用在更为积极、正面的地方吗?简单的回答就是:要看情况。实际上,它可能比你想象的要复杂得多。我们也许会遇到许多意想不到的问题,也许会产生一系列下游效应。我们必须考虑周全,绝不能轻举妄动。
简单总结一下吧。在医学领域,我不会因为某种干预仅能激发安慰剂效应就认为它有效。在其他情况下(比如改变工作环境),我不会为了达到更好的效果而去做违反常理、极端或违背人伦道德的事情。但是,为了让人们能感觉到你时刻在关注他们,关心他们,随时准备听取他们的意见,采取相对温和而适度的干预手段倒不失为一个好办法(即使起不到什么特殊的作用),也说不定能够因此让工作文化有所改善。
总之,哪怕干预手段看上去有那么一点效果,你也最好不要相信那些奇奇怪怪的理论。
如何区分什么是真正的特定效应,什么是研究过程中(或者进行干预后)产生的非特定的人为效应,这是每一个科研人员都会面临的问题。从这个意义上说,甚至专家也无法完全掌握复杂的事实真相。
适应性行为是指一个人对外界环境的变化的适应能力,也包括其处理日常生活及在社会环境中求生存的能力。——译者注
准实验是将严谨的科学实验方法论用于解决实际问题的一种研究方法。它允许在某些方面降低控制水平,但会尽可能运用科学实验的设计原则和要求,最大限度地控制因素。因此虽然产生的结论严谨度稍差一些,但是在无法达到全变量控制的情况下,还是具有广泛的应用性。——译者注
下游效应是一种比喻的说法,指的是因为前一个事件的发生而导致的相应后果。——译者注