现在的位置: 首页 > 读书笔记 > 正文
【读书笔记】伪装成因果关系的“回归效应”
2013年02月01日 读书笔记 ⁄ 共 3062字 评论数 1 ⁄ 被围观 2,664 views+

一位以色列的飞行教练发现:当飞行员完成一项完美的飞行特技动作后,如果他给予赞许,这位飞行员在下一次完成同样的动作时,表现会差一些;对于表现不好的飞行员,如果他向其怒吼,这位飞行员在下一次飞行中通常会表现得更好。

你是否也有过类似的生活经验?反正我有。但是,丹尼尔·卡尼曼通过他的《思考,快与慢》第17、18章告诉我们,这其实只是一种错觉,这种现象被称作“回归平均值”——看来这两章的内容注定会非常精彩!

一、“回归平均值”现象:(第17章)

丹尼尔·卡尼曼认为“第二次的表现与第一次并无因果关系”,所以,人们依据某人第一次的表现来预测其第二次表现的方法并不可靠,更可靠的方法是依据这以前所有表现的“平均水平”来预测。

为了说明“回归平均值”现象,作者提出了一个公式:

  • 成功=天赋+运气;

  • 巨大的成功=更多的天赋+更多的运气。

如果认为“天赋”是固定的,那么“运气”就是可变的,某人第一天的表现很好,其原因可能是第一天的“运气”非常好,如果第二天的运气比较差(通常就是如此),那么第二天的表现就比较差。如果结合开头以色列教练的例子,就是说,教练的“赞许”或“怒吼”与飞行员的表现根本没有关系,既然如此,为什么不接受作者对技能训练所提出的那个重要原则呢?——“对良好表现的嘉奖比对错误的惩罚更有效。”

既然“运气”是随机的,那么对某人第二天表现最准确的预测通常是最保守、最接近平均值的,而不是基于第一天的预测,所以,原始数据越极端,回归的可能性就越大(例如:第一天的表现距离平均值越远,第二天的表现就越可能回归平均值,反过来,如果根据第二天的表现预测第一天,也是如此)。这便是“回归平均值”现象。

二、“回归性”与“相关性”:(第17章)

前文中的“回归效应”说起来很简单、而且无所不在,但其实很复杂。19世纪,高尔顿通过对植物株高的遗传研究,最早发现了“回归平均值”现象——子代的株高向本物种的平均水平回归,但是又经过多年的研究,他才进一步发现:

“相关性和回归性并非两个概念——它们只是从不同角度对同一概念做出的阐释这个概念的原则是:只要两个数值之间的相关度不高,就会出现回归平均值的情况。”

*相关性和回归性非常抽象,它们之间的关系也很抽象,但这是我从本章学到的最重要的知识,而且书中几个例子的说明是比较清楚的。

*通过高尔顿的揭示,现在从直觉上理解相关度与回归效应,就是很容易的:如果两个值完全相关,影响一个值的因素必然同样程度影响另一个值,于是两个值同增同减,但是他们之间的差距是固定的,当然就不会有回归效应了。

相关性和回归性的解释:

  • 1.对“相关性”的理解可以借助于“相关系数”的概念,两个值的“相关系数”是指“两个值共有因素的相对比重”。如果相关系数为1,任何影响其中一个值的因素都会影响另一个,两者享有同样的决定因素;如果“相关系数”从1开始减小,说明影响两个值的共有因素所占比例在减小,直到减小到0,也就是两个值完全不相关。

*借助以前的数学知识,我觉得这里的“相关系数”的数值仍然是指“线性相关”,还无法表征“非线性相关”。

  • 2.如果两个数值的“相关性”不是绝对的(也就是说,只要两个值不是完全不相关度),那就一定会发生“回归平均值”现象。

  • 3.由于我们的思维对因果关系的解释带有很强的偏见,而且不善于处理统计数据。所以,当回归效应出现时,对其按照因果关系进行解释就会自动激活(例如:自动将第一天的表现作为原因,以此预测第二天的表现),但实际上这种解释是不对的。讽刺的是:用因果关系解释回归效应往往会得到现实的认同,否则,就好象书中说的那样:商业评论员声称“今年的生意比去年好,因为去年太遭了。”——也许他合理解释了回归效应,却可能因此丢掉饭碗。

  • 4.不仅是普通大众,杰出的研究者也会对回归效应做出错误的因果解释——将“相关性”和“因果性”混淆在一起。

***书读到这里,我被丹尼尔·卡尼曼所说的“回归效应”震撼了,因为此前的理念是:因果关系是普世存在的,而且在前面的阅读者,针对当时所提出的问题,在前文中也写过如果否定因果关系,文明会停滞的内容。但是现在不得不承认“回归效应”的确存在,而且我觉得很难与因果关系区别。

***尽管“回归效应”会使得我们对事物的解释变得简单,甚至像上文中的商业评论员那样荒唐,但我还是觉得应该认定:因果关系是主流,“回归效应”只不过是花絮——这只不过是自然界偶尔和我们开的玩笑。

三、对直觉性预测的偏见进行修正的方法:(第18章)

“朱莉现在是一名州立大学4年纪的学生。她4岁就能流畅地进行阅读,她的平均绩点(GPA)是多少?”

*对于“平均绩点”,直接理解为大学成绩吧。

第18章探讨的是“如何对直觉性预测产生的偏见进行校正”——因为直觉性预测不具有回归性。作者首先通过这个朱莉的事例告诉我们,通过直觉进行预测的步骤可能是这样的(显然,这是借助系统1实现的):

  • 1.寻找证据与预测目标之间的因果关系->

  • 2.借助相关规范(例如:参照人群)对证据进行评估->

  • 3.进行问题“替代”和快速配对->

  • 4.进行强度匹配。

  • 穿插在这些步骤中的还有联想记忆的大量激活:由信息和问题激发联想记忆,然后自我反馈,最后选定最具连贯性的合理方案。

显然,上述步骤不可避免地会出现“直觉性预测的偏见”——根据书中的解释,就是“直觉性预测需要校正是由于它并不具有回归性”,为了寻找修正这种偏见的方法,借用类似第17章探讨“回归效应”中“运气”因素的公式,也写出一个决定因素公式:

  • 阅读年龄=共同因素+决定阅读年龄的特殊因素=100%;

  • 平均绩点=共同因素+决定平均绩点的特殊因素=100%;

这里的“共同因素”包括由遗传决定的潜能、家庭支出学业的程度,以及能够造成人们在孩童时期成为出色的阅读者、青年时期又在学术上有所建树的所有其他因素。

以下是作者借此公司提出的进行无偏见预测的4个步骤:

  • 1.先估测出平均绩点的平均值。

  • 2.根据你对证据的印象算出与之相匹配的平均绩点。

  • 3.对你的证据和平均绩点的关联做出估计。

  • 4.如果关联度是0.3,则从估算出的平均绩点的平均值中抽取30%,放到与之匹配的平均绩点里。

对上述步骤的有关说明:

  • 1.步骤1是你只知道朱莉是个快毕业的大学生之外,其他什么都不知道的情况下,对她平均绩点的预测(也就是基准线)——你很可能认为她是一般水平的毕业生,也就会参考毕业生的平均水平。

  • 2.步骤2是你的直觉性预测,是你将“她4岁就能流畅阅读”的证据,与你的目标匹配的结果——你可能预测她确实比一般毕业生优秀。

  • 3.步骤3是你所估计的“关联度”,对照前面的公式,就是你认为“共同因素”占“决定因素”的比例(通过回想两式的关联,你会发现“共同因素”在其中的比例是相同的),例如:你认为“共同因素”的所占比例是30%,那“关联度”就是0.3。

  • 4.步骤4已经说明了结果,也就是:将步骤2估算出来的平均绩点乘以0.3(相当于通过“4岁能流畅阅读”的证据,将阅读年龄中的“共同因素”提取出来),将步骤1估算出的平均绩点乘以0.7(1-0.3=0.7,相当于将平均绩点中的“决定平均绩点的特殊因素”提取出来),然后将两者相加,得到最终的预测结果。

*以上诸条,由于书中文字有些含糊,所以部分内容由我根据自己的理解进行诠释,正确与否,请参考原书英文版。

本章最后,作者还探讨了直觉性预测的问题:他以“两位教授,你应该选择哪一位?”为例,说明了人们的直觉会产生极端预测,并且还对这种极端自信满满——这当然是系统1造成的,所以,人们需要意识到“回归性”并借助系统2来校正直觉预测。

抱歉!评论已关闭.

×