第1章:思维与决策的认知基础
1.1 决策是一种可习得的技能
决策对人类生存的意义
- 人类主宰地球并非依靠敏锐的感觉或强健的体魄,而是依赖于能够做出好的决策这一独特技能。
- 决策能力关乎技术发展与存亡,好的决策带来进步,坏的决策则可能导致灾难。
本书的研究焦点与核心发现
- 焦点:研究人们如何决策,而非应该选择什么。
- 核心发现:
- 不同个体在不同情境下的思考方式具有共同性。
- 我们共享一套认知技能,但也存在普遍的局限性。
- 当决策任务与进化环境中的任务不同时,这种局限性尤为明显。
决策技能的习得与改善
- 核心观点:明智的决策是一种需要学习的技能,会随经验而改善。
- 类比:学习决策如同学习游泳。
- 初始的错误本能(如学游泳时拼命将头露出水面)会导致不利结果。
- 改善技能的关键在于识别并消除不利的思维错误。
- 本书目标:
- 描述并解释不利的思维习惯。
- 提供改善决策技能的策略(而非告知目标、偏好或如何实施决策)。
- 引入“对理性决策过程本质的分析”视角来理解决策。
生活是一门艺术,要在不充足的前提下得出充足的结论。——塞缪尔·巴特勒(英国作家)
我没有足够的权力建议你,应该选择什么,但如果你愿意聆听的话,我可以告诉你如何决策。——本杰明·富兰克林(1772年信件)
1.2 思维:自动思维与控制性思维
思维的本质定义
- 定义:思维是针对并不存在于即时环境中的事物所创造出的心理表征。
- 例子:想象墙被漆成蓝色(思维) vs. 看见绿色的墙(非思维)。
- 思维是知觉的扩展,用于填补感知图片的空缺并推测因果关系。
思维是一种“在已知现象中填补空缺”的技能。——弗雷德里克·巴特利特 (1958)
两种基本思维过程
- 自动思维
- 特征:快速、无需意识努力、联想性。
- 最简形式:单纯联结(一个想法激起另一个想法或记忆)。
- 例子:开车时的预期与操作、直觉。
- 原型:日常驾驶、专家直觉。
- 控制性思维
- 特征:有意识、需要努力、基于假设。
- 形式:包括“如果……那么……”的形式运算思维、视觉想象、创造等。
- 核心:认为“相比可能性,现实是次要的”(皮亚杰)。
- 原型:科学推理、逻辑批评。
区分案例:虐待儿童者的推理谬误
自动思维的推理(存在偏差)
- 现象:临床心理学家认为“所有施虐者都不会自觉停止施虐”。
- 推理过程:
- 自动地将接触到的(寻求治疗的)施虐者特点与“所有施虐者”联结。
- 忽略了一个关键集合:那些未经治疗就主动停止的施虐者(系统性的“非可获得性”偏差)。
- 结论可能存在混淆:是低自尊引发负性行为,还是自我意象问题促使人们寻求治疗?
控制性思维的介入
- 方式:使用“如果……那么……”的逻辑进行批判。
- 关键:指出样本的局限性(只接触了未停止施虐的群体)。
- 合理结论:应该是“不知道”,并需要寻找更多证据。
两种思维在复杂任务中的结合
- 核心观点:任何伟大的智力成果都是两者的结合,比例难以简单区分。
- 企业高管:声称“直觉”决策,实则可能已系统考虑过选项。
- 国际象棋特级大师:
- 研究发现(Simon & Chase, 1973):其技能基础更多是自动化的即时视觉加工(在5秒内编码熟悉棋局的意义),而非随后的深度逻辑推理。
- 他们依赖长时记忆中存储的大量棋局模式和经验(约需50,000小时练习)。
本书的基本观点
- 人们在判断和选择时常使用自动思维,这可能导致较差的结果。
- 控制性思维并非永远完美或优于直觉。
- 目标是认识两种思维的相对优势,并知道在何种情境下信赖哪种思维。
1.3 心理的计算模型
认知科学的范式转变
- 核心假设:通过将脑的活动描述成对符号的操纵,可以认识思维的本质。
- 重要提醒:这仅是类比(大脑与计算机功能相似,但内部结构截然不同)。
计算模型的核心:符号加工
- 心算示例:展示了两种不同的内部计算策略,但都通过操作符号(数字)得到相同答案。
- 关键:思维过程具有“令人惊讶的灵活性”。
- 认知革命:使用计算机编程语言描述和模拟人类认知技能(如象棋、推理)。
编了程的计算机和问题解决者一样,都是隶属于“信息加工系统”的物种……环境的要求与信息加工系统的一些基本参数(尤其是系统记忆的特征)会产生交互作用,从而导致信息加工系统产生出各种复杂行为。——纽厄尔与西蒙 (1972)
人类信息加工系统的架构
- 现代共识模型:包含多个加工模块和记忆缓冲器,围绕中央工作记忆运作。
- 三个关键记忆存储:
- 感觉输入缓冲器:短暂保存感觉信息。
- 短时工作记忆:容量有限,是大多数有意识思维的发生地。
- 长时记忆:容量(几乎)无限,存储事实、概念、程序。
记忆特性对决策的关键影响
- 工作记忆的有限容量
- 是导致有限理性和偏离最优行为的主要原因之一。
- 限制了人们能够同时考虑和操作的信息数量。
- 长时记忆的知识存储
- 专家(如象棋大师)与新手的核心差异在于长时记忆中存储的知识量与知识组织方式。
- 解释了为何大师能快速识别有意义的棋局模式。
有限理性不仅源于“信息超载”(工作记忆限制),也源于自动联结等思维习惯。
1.4 从精神分析与行为主义到认知
20世纪中叶前的主导流派及其局限
- 精神分析理论
- 焦点:无意识冲动、欲望与童年创伤。
- 解释行为:通过防御机制将无意识冲动转换为行为。
- 对纳粹主义的失败解释:试图用领导人的性心理变态等病态解释暴行(如对希特勒的分析),但缺乏证据且预测失败。
- 关键忽略:个体的认知假设、思维风格和问题解决方式。
平庸之恶。——汉娜·阿伦特(针对阿道夫·艾希曼研究后提出)
相关案例:米尔格拉姆的服从实验
研究发现,各种各样的被试在实验时都会向一个陌生人实施极度痛苦并可能致命的电击,前提是有一个“为该事负责”的实验者敦促被试这么做。——斯坦利·米尔格拉姆 (1963)
- 意义:证明了“平庸之恶”的假设,即即刻的社会情境能让普通人做出极端行为。
- 行为主义
- 焦点:行为之后的强化(奖励/惩罚)决定习惯形成。
- 观点:意识不重要,是“伴随现象”。
- 局限:无法充分解释复杂智力活动(交流、下棋、决策)和某些学习现象(如已准备好的学习)。
认知心理学的兴起
- 转折点:概念识别实验等研究证明,有意识的假设检验是学习的关键中介。
- 莱文(1975)实验:证明如果概念不在被试的“假设集合”中,他们将无法学会。
- 鲍尔与特拉巴索(1968)实验(交替反转程序):即使强化模式混乱,被试仍能学会规则,这只能用主动的假设检验来解释。
- 基本假设:思想和信念导致行为。要理解行为,最佳途径是了解决策前的思维。
- 本书路径:利用认知科学概念理解判断与选择。
1.5 选择的质量:理性
评价决策好坏的复杂性
- 不能仅由结果判定。需考虑结果概率、结果对决策者的价值以及决策时的情境。
- 例子:在绝境中赌“蛇眼”(概率低)可能是理性的,因为它是唯一的出路。
理性的技术性定义(四条标准)
一个理性的选择需要满足:
- 基于决策者目前的资产(包括金钱、生理、心理、社会关系等)。
- 基于选择的可能结果。
- 当结果不确定时,用概率论基本原理评估可能性。
- 在与结果相联系的概率、价值约束下,选择应具有适应性(即逻辑上一致地追求目标)。
理性在此是狭义的技术定义,用于判断决策过程是否逻辑自洽,而非评判目标或道德优劣。
为何需要理性标准?
- 违背任何一条标准都可能导致矛盾的结论(如认为一个行为既可取又不可取)。
- 例子:若同时关注当前资产和与过去相比的资产变化,可能觉得继续一个亏本项目既明智又愚蠢。
常见的非理性决策程序
人们常使用以下与理性标准无直接关联的程序:
- 习惯:重复过去的选择。
- 一致性:模仿大多数人或钦佩的人。
- 宗教或文化原则:基于信仰或背景做选择。
1.6 现代决策理论的产生
期望效用理论
- 起源:冯·诺依曼与摩根斯坦的《博弈论和经济行为》(1947)。
- 核心原则:理性决策者应选择期望效用最大的选项。
- 期望效用 = 结果的概率 × 该结果对决策者的个人价值(效用)。
- 与期望值的区别:决策基于效用(主观价值),而非仅仅是货币价值的数学期望。
期望效用理论的检验与矛盾
- 示例矛盾:
- 在 (a) 0.20概率赢30 中选 (a)。
- 在 (a‘) 0.80概率赢30 中选 (b’)。
- 逻辑矛盾:两组选择暗示了对U(30)比值相互矛盾的要求。
- 意义:违背期望效用理论,即违背了理性的四条基本标准。
关于理性模型的两种观点
| 观点阵营 | 代表人物/领域 | 核心主张 | 理由 |
|---|---|---|---|
| 乐观派(描述性) | 传统经济学家(如加里·贝克尔) | 人们的实际决策大体符合期望效用最大化。 | 观察宏观市场行为;认为进化与学习会淘汰非适应性习惯。 |
| 悲观派(描述性) | 心理学家、行为经济学家 | 人们的实际决策常系统性地违背理性原则。 | 研究微观个体决策;发现系统性的认知偏差与思维习惯。 |
本书的研究方法
- 采用规范性(理性应如何)与描述性(实际如何)相结合的视角。
- 目标:理解理想理性与实际行为,洞察人性,并通过认识背离理性的情况来改进思维技能。
第2章:决策的定义、表征与理性分析
2.1 决策的定义与要素
决策的基本含义
- 核心比喻:如同行至岔路口,选择一条路径以达到渴望的目标或避免不愉快的结果。
- 进化基础:通过自然选择,人类具备了趋利避害的基本决策能力。糟糕的决策在进化史上会遭到严厉惩罚(即未能繁衍便死亡)。
有一些生物体,由于世代累积的一些错误来到这个世上,具有一种异常凄惨但又值得称颂的倾向,即在繁殖他们的后代之前死去。——W.V.O·奎因 (1969)
决策的三要素(科学定义)
一个决策是特定情境中的一种反应,包含三个必要部分:
- 行动方案:存在不止一个可供选择的行动方案。
- 预期与信念:决策者对每个方案的结果和未来事件形成预期,常以信心程度或概率形式呈现。
- 评估与价值:可能的结果可以根据当前目标和价值观在一个连续体上被评估(产生积极或消极的后果)。
决策的精髓在于信念(对客观事件的看法)与评估(对事件的主观价值判断)的整合。
决策的范畴与本书焦点
- 范围:表2.1中的例子表明,决策通常是有意的、可意识到的心理过程,但也存在高度自动化的决策(如驾驶、眼动)。
- 本书焦点:主要关注有意的、可控制的决策过程。
- 延伸:对自主控制下具有长期结果的行为(如决定减肥),其初始行为事件被视为决策,但后续的坚持与执行过程不在本书主要探讨范围内。
记者:你还没有拿定主意? 尤吉·贝拉:据我所知并非如此。
2.2 决策的图解表征(决策树)
决策树的作用与构成
- 作用:总结决策情境要素,便于应用决策理论原理,辅助选择最佳方案。
- 基本符号:
- 方框 (□):表示选择点(决策节点),决策者在此选择行动方案。
- 从方框引出的线:代表不同的行动方案。
- 圆圈 (○):表示机会节点(事件节点),代表决策者无法控制的不确定结果。
- 从圆圈引出的线:代表不同可能结果及各自的发生概率(标在线上)。
- 最右侧:列出每个路径的最终后果及其个人价值(通常用0-100的数值表示)。
图解示例
- 医疗决策(图2.1):面临膝盖损伤,选择手术与否。后果价值从“手术失败”(0) 到“自然恢复”(+100)。
- 赌博决策(图2.2):在(a)0.2概率赢30之间选择。用货币金额直接表示价值。
- 关键问题:在受控赌博任务中揭示的决策习惯,能否推广到复杂的现实生活决策中?
2.3 再论决策质量:理性预期原则
理性决策的计算方法
- 理性预期原则:通过计算每个行动方案的期望效用来做出理性选择。
- 计算公式:
期望效用 = Σ (概率_i × 价值_i) - 计算前提假设:
- 能用数值表示概率和价值。
- 决策者的思维过程可用算术运算(加、乘)模拟。
- 决策者考虑了模型中所有的且仅有的选项、可能状态及后果。
计算应用
- 医疗例子(图2.1):
- 手术期望效用 = (+80×0.65) + (0×0.35) = +52
- 不手术期望效用 = (+100×0.30) + (+20×0.70) = +44
- 理性选择:手术。
- 赌博例子(图2.2)(假设美元价值即个人价值):
- 选项 (a) 期望价值 = (0×0.80) = $9.00
- 选项 (b) 期望价值 = (0×0.75) = $7.50
- 理性选择:(a)。
现实中大多数决策并不符合该原则,但该模型为分析和改善决策提供了有用的起点。
2.4 不完整思考:现象与案例
现实中的非系统性思考
- 问题:人们在重要决策时(如陪审团裁决),往往不进行决策树所体现的充分、一致的思考。
- 表现:通常只聚焦于一两个最吸引人的选项及其后果,而忽略其他选项的潜在收益与损失。
- 心理机制:
- 首因效应/确证性假设检验:初始印象控制后续思考,只寻找支持该印象的证据。
- 可得性偏差:想法被最易获得(可得)的经验所控制(如第1章心理治疗师的例子)。
决策案例:陪审团裁决
- 决策树(图2.3)展示了完整的四种后果及其概率与价值。
- 但陪审员实际决策时,常基于对被告的初始印象(有罪/无辜),仅评估与之相符的后果路径,进行不完整的分析。
普遍性
- 该倾向普遍存在于日常生活决策中(如青少年的学业、社交、高风险行为决策),人们通常只关注少数最凸显的可能性和后果。
2.5 沉没成本谬误及其解释
沉没成本的定义与理性原则
- 沉没成本:已经发生且不可收回的支出(金钱、时间、精力等)。
- 理性原则:理性的决策应仅基于未来的后果。沉没成本与未来决策无关,不应影响未来选择。
沉没成本谬误的表现
- 现象:人们倾向于在决策时过度关注已投入的沉没成本,并因此继续投入,导致“赔了夫人又折兵”。
- 典型情境(图2.4):
- 滑雪案例:因已花费$90购买无法退款的滑雪票,尽管天气恶劣、体验糟糕,仍选择留下滑雪。
- 核心谬误:将“避免浪费已花的90已沉没,留下的唯一理由应是“留下比回家带来更多未来愉悦”。
相关案例与名言
终于,那一天还是到来了。你应该更有逻辑地、更实际地思考。已经花费了如此之多的金钱,有如此之多的军队已经聚集在了这里,这么多人度过了这么多艰难的岁月,如果不教训一下别人的话也太说不过去了。——罗比·费尔顿警长(1991年海湾战争爆发时)
- 其他案例:越南战争/伊拉克战争(“我们的孩子不能白白死去”)、田纳西-汤比格比水道工程、协和式客机研发。
- 理性反例:日本天皇1945年无条件投降(着眼于避免未来毁灭);福特公司放弃“埃德塞尔”汽车(转向开发成功的“野马”)。
对沉没成本关注的“理性”解释
在特定情况下,关注沉没成本可能是理性的,因为放弃它可能带来未来的负面后果,例如:
- 声誉损失:被视为浪费、愚蠢或懦弱(图2.5)。
- 信号作用:在组织内,放弃项目可能被解读为缺乏决断力,影响未来权威。
但沉没成本本身不应是因素,只是因他人认为它重要,放弃才会带来问题。
对沉没成本谬误的理论解释
- 进化生物学视角:早期用“沉没投资”解释父母遗弃行为(Trivers, 1972)被修正。更合理的解释是对未来后代存活需求的敏感性,而非关注已投入的成本。
- 过度概括行为准则:可能是对“俭以防匮”、“坚持到底”等有益行为准则的过度应用(Arkes & Ayton, 1999)。有证据显示成年人比年轻人更易犯此谬误。
- 实验证据:Arkes & Blumer (1985) 的实验表明,购买全价剧院季票(沉没成本高)的顾客,比购买折扣票的顾客观看次数更多,排除了自然情境中的模糊解释。
应用建议
- 可通过重构沟通框架来减少放弃沉没成本的社会阻力:强调是“明智地避免确定性的进一步损失”,而非“放弃一项事业”。
- 将注意力从过去的损失转移到未来的收益/止损上。
2.6 仅考虑未来的理性
概率思维的核心
- 基本原则:概率估计应仅参照未来事件。过去已发生的事件不影响未来独立事件的概率(如抛硬币)。
- 历史背景:该思想在文艺复兴时期随概率论发展而兴起。
- 经典问题:帕乔利(1494)的 balla 游戏奖金分配问题。
- 错误方法:按已赢轮数比例(5:3)分配(关注过去)。
- 正确方法(Peverone, 1558):按未来获胜的概率(7:1)分配(关注未来)。
过去与未来的关系
- 过去的合理作用:过去事件仅在能为估计未来状态的可能性提供信息时才相关(例如,一枚硬币过去20次有19次正面朝上,暗示其可能有偏)。
- 结论:理性决策建立在清晰区分过去与未来的基础上,基于对未来可能性和后果的评估,并放弃沉没成本(除非放弃会引发更严重的未来问题)。
2.7 本书其余部分概览
决策研究的两个基本问题
- 何为好决策?
- 传统标准:符合逻辑与概率论规则的决策。
- 现代发展:开始纳入其他评估“好”的指标,并考察决策过程在复杂、对抗性环境中的稳健性与“生存能力”。
- 决策因何困难?
- 智力因素:选项数量、潜在损失、不确定性程度、权衡的复杂性。
- 情绪因素:对价值观的威胁、决策伴随的情绪强度、时间压力等。
本书后续结构
- 判断心理学(第3-8章):知觉系统的扩展,如何超越感官信息进行推断。
- 价值与效用心理学(第9-10章):如何知晓和预测我们的偏好。
- 现代决策理论(第11-12章):理性决策理论及其心理学的修正与发展。
第3章:判断的整体框架与线性模型的优越性
3.1 引言与判断的概念框架
本章主旨
- 本章旨在介绍判断的心理机制,即人类推理、估计和预测未知事件的能力。
- 核心问题:我们的判断能力常受系统误差影响,其中最突出的是过度自信。
心理学已经忘却了自己是一门研究有机体和环境之间相互作用的科学,而演变成了一种只研究有机体的科学。这让人不禁想起了那些大男子主义膨胀的中世纪神学家,他们认为只有男性拥有灵魂,而女性没有。——埃贡·布伦斯威克(心理学家)
判断的重要性与复杂性
- 人类大脑能超越感官信息进行复杂的推断(如三维视觉、疾病诊断),这是进化赋予的非凡能力。
- 判断过程常常是无意识的,难以被内省察觉(如“盲视”现象)。
决策案例:斯科特的南极探险
这位探险家没能寻找到南极极点,在仅离返回补给站17公里的地方,因饥饿和精疲力竭湮没在南极的冰天雪地里。——历史评论认为,除了厄运,斯科特一系列糟糕的判断应对失败负责。
- 启示:即使目标崇高,糟糕的判断也可能导致灾难性后果。
3.2 透镜模型:一个整体的分析框架
透镜模型的提出与核心理念
- 提出者:埃贡·布伦斯威克。
- 核心比喻:我们的感官通过介于外部世界与内部知觉之间的“透镜”(即线索)获取信息。
- 核心要求:完整的判断理论必须包含行为发生的环境。该模型是一个概念框架,用于组织判断情境的各个部分。
透镜模型的构成(图3.1)
模型分为左右两部分,通过中间的“线索透镜”连接。
- 左侧(环境/生态):表示真实世界。
- 效标 (Ye):待判断的真实情形或目标(如一个人的真实年龄)。
- 线索 (X1, X2…):可观察的、与效标相关的信息(如头发、皮肤、步态)。
- 生态效度:线索与真实效标之间的统计关系(通常为相关系数)。
- 右侧(心理/认知):表示判断者的心理过程。
- 线索利用:判断者如何感知和整合线索以形成判断 (Ys)。
- 线索利用系数:线索对判断的心理影响力。
- 成就 (ra):判断 (Ys) 与真实效标 (Ye) 之间的相关,代表判断的准确性。
透镜模型强调,判断是试图通过不完美的线索来洞察真实世界状态的过程。
应用案例:预测博士项目申请者
- 研究:分析作者海斯蒂如何依据28条线索(测验分数、推荐信、大学质量等)评估申请者。
- 方法:使用线性回归分析其245份评估数据,构建模型预测其判断。
- 结果方程:
准入资格 = 0.38*测验A + 0.34*测验V + 0.19*推荐信 + 0.09*大学质量 - 关键发现:
- 模型仅用4条线索就出色地“捕获”了海斯蒂的判断策略(模型预测与其实判断相关达0.90)。
- 模型的预测信度(0.90)接近其本人重测信度(0.88)。
- 局限:该模型描述了如何判断,但未说明应该如何判断(后者需要分析左侧的生态效度)。
3.3 透镜模型下的研究发现与专家形象
使用透镜模型的研究策略
- 确定与测量线索:常需多轮试验,尤其对直觉判断(专家常无法报告所用线索)。
- 对环境建模(左侧):通常使用线性回归分析效标与线索的生态关系。
- 对心理过程建模(右侧):分析判断者如何利用线索,通常也使用线性模型。
关于人类(含专家)判断的典型发现
- 线索使用少:判断者通常只依赖3-5条线索。例外存在于有及时准确反馈的领域(如气象、牲畜评级)。
- 策略多为线性:大多数判断策略是可加的、线性的,这与判断者自认为的复杂过程相反。
- 缺乏自知之明:判断者,尤其是专家,无法准确洞察自己的判断策略(线索权重)。
- 个体差异大:不同判断者之间的策略和一致性很低,这在医疗诊断等领域令人不安。
- 无关信息增加自信:提供非诊断性信息会提高判断者的自信,但不会提高准确性。
专家的专业形象常令人失望,其判断水准可能与新手无异。但确实存在真正的专家,其价值在于知道“该使用哪些线索”。
3.4 统计模型与专家判断的实证比较
里程碑式研究综述
- 保罗·米赫尔 (1954):对比约20个研究,发现统计模型的预测准确性均优于或等于临床(专家)判断。
- 杰克·索耶 (1966):回顾45个研究,无一显示临床判断优于统计预测。即使专家拥有更多信息(如面试),其预测也不如基于客观数据的模型。
- 案例:二战水手训练表现预测,仅用测验分数优于结合面试的判断。
- 埃·洛厄尔·凯利 (1954):指出非结构化面试作为一种预测工具几乎无效。
关键实证案例
- 古德堡的精神病诊断:
- 任务:根据人格测验分数区分精神病与神经症。
- 结果:简单的“Goldberg法则”(加三减二)准确率约70%,而专家判断最高仅67%。
- 艾因霍恩的霍奇金淋巴瘤预后:
- 任务:根据活检切片预测患者生存期。
- 结果:世界级专家的总体评估与患者实际寿命无关,甚至方向错误(评估更严重者活得更久)。而基于9项特征的线性回归模型则具有预测力。
- 利比的破产预测:
- 任务:银行信贷员预测公司破产。
- 结果:人工判断准确率75%;基于相同财务数据的回归模型准确率82%。
总体结论
对两种方法的预测准确性进行实证比较(包含136个涉及各种预测的研究),其结果表明,机械的方法几乎总是和临床方法不相上下,甚至更加优越。——格罗夫与米赫尔 (1996)
- 核心建议:向专家咨询该使用哪些线索,但让机械模型来整合线索并做出判断。
3.5 统计模型为何优于人工判断
三大解释原理
- 数学原理:大多数单调(非交叉)的交互作用可以近似为线性模型。现实中,复杂的交叉交互作用非常罕见(图3.2)。
- 自然原理:现实世界中,大多数变量间的交互作用本身就是单调的,因此线性模型能很好地拟合环境结构。
- 心理学原理:人类很难同时整合多个不可比维度的信息,常采用“锚定与调整”策略(先关注最突出线索,再微调),这虽然高效但非最优。线性模型能公平、一致地校准所有线索。
专家优势通常在于知道“该注意什么”(线索选择),而非更优的“信息整合方式”。
3.6 线性模型对实践的启示
核心主张
- 广泛替代:一旦可能,应以线性模型判断替代人工判断(需经实证测试)。
- 效率与公平:统计模型比人类判断更高效、公平和准确。
令人惊讶的发现:“不合理”模型也有效
- 道斯的研究:即使使用随机权重(仅符号正确)或单位权重(所有线索等权,仅符号正确)的线性模型,其预测力也平均是专家直觉判断的1.5至2.61倍。
- 启示:在整合线索时,系数的符号(方向)比具体的权重数值更重要。
- 自举引导式:收集专家的判断数据,为其拟合一个线性模型,再用此模型替代该专家进行判断。该方法总能胜过专家本人,主要归功于模型的稳定性和线性形式的强大。
3.7 对线性模型的常见反对与辩驳
| 反对理由 | 辩驳与解释 |
|---|---|
| 1. 冒犯专家自恋/威胁收入 | 虽属实,但不能否定模型的实证优势。质疑具体研究中专家资质通常是特设性辩护。 |
| 2. 只对琐碎、短期预测有效 | 长期预测往往更容易(如人人终将死亡),而研究关注的是有难度的、可变的预测。且无证据表明人工判断在“重要”长期预测上更优。 |
| 3. “不可能所有人都错” | 专家判断的社会功能(提供安慰、彰显努力)与其效度是两回事。高收费和敬畏感不等于高准确性。 |
| 4. 模型不灵活,无法处理特例 | 承认模型在处理全新情况时可能需要调整。但常规决策中,模型的公平与一致性优势远超其局限性。 |
3.8 反馈可得性问题及其启示
反馈的偏差如何维持对直觉的迷信
- 问题:我们对直觉判断的反馈是片面和有偏的。
- 选择性记忆:只记住成功,忽略或“解释掉”失败。
- 自我实现预言:判断本身可能影响结果(如服务员因预期小气而提供差服务,最终确实得到小费)。
- 结果缺失:无法得知被拒绝的申请者、被误诊的病人后来如何(“消失的效标”)。
相关案例
一些艺术历史学家看到这尊雕像的第一眼时便倒吸了一口凉气……他感觉到了一阵“直觉上的厌恶”。——关于盖蒂博物馆“科诺斯”雕像真伪的争论(Gladwell, 2005)
- 启示:我们只听到直觉判断成功的轶事,却不知有多少次失败未被提及(如同赌“蛇眼”成功的个例掩盖了多数失败者)。
我很同情她,就把一美元递给了她……几个星期过去了,我仍然没有收到她的来信!……这点小钱一点也不重要,但是这却动摇了我对人的信心和看法。——“害羞的一美元”写给“亲爱的阿比”的信 (1975)
- 启示:判断者常将失败归咎于外部(他人品性),而非质疑自身的判断能力。
接受不确定性的现实
- 许多重要结果(如学业成就、疾病预后)本身包含大量“不可降低的不确定性”。
- 线性模型可能只解释了18%的变异,但专家判断可能为0%。“有缺陷的预测好过没有预测”。
- 例子:研究生表现受机遇因素(室友、教授、竞争环境)极大影响,形成“自我放大”的职业生涯路径。
3.9 判断在决策中的角色
线性模型在决策中的应用
- 决策中的判断:决策常要求我们预测未来的偏好和结果。
- 富兰克林的方法:列出选项的利弊,权衡其重要性后加减,本质上是线性模型。
- 实用建议:在涉及多重因素的决策中,运用(即使是简化的)线性模型进行判断和选择,比依赖神秘的直觉更可靠。
最终立场
- 核心信条:“只有数字才是真实的”。应克服对“神秘人脑”的迷信,像信任工程数字一样,信任经过检验的、可控的量化判断方法。
- 根本挑战:人类普遍存在的过度自信,阻碍了我们采用更优的、基于数字的决策工具。
第4章:锚定与调整——判断的基础启发式
4.1 引言与核心概念
给我一个支点,我能撬起地球。——阿基米德
本章主旨
- 本章旨在深入探讨第3章线性模型背后的潜在认知过程,即锚定与调整这一基本判断策略。
- 核心观点:人们在判断时,倾向于从一个初始值(锚)出发,并进行不充分的调整,从而导致最终判断偏向该锚点。
4.2 锚定效应的表现与实验证据
锚的定义与来源
- 锚:任何在判断过程中被作为起点的凸显的值。它可以是相关的信息,也可以是完全随机或无关的数值。
- 作用:在模糊或不确定的情境下,锚会戏剧性地影响估计结果,导致调整不足。
经典实验证据
-
随机锚的影响(Tversky & Kahneman, 1974):
- 任务:估计联合国中非洲国家比例(正确答案35%)。
- 操纵:通过预设的“幸运转盘”让被试先接触一个随机数字(10或65),再判断比例是高于还是低于此数。
- 结果:看到“10”的被试估计均值为25%;看到“65”的被试估计均值为45%。
- 结论:即使锚是随机产生的,也会显著影响最终判断。
-
顺序作为锚(Tversky & Kahneman, 1974):
- 任务:心算估计
8!(正确答案40320)。 - 操纵:算式以两种顺序呈现:
- 递增:
1×2×3×4×5×6×7×8→ 估计中值 512 - 递减:
8×7×6×5×4×3×2×1→ 估计中值 2250
- 递增:
- 结论:算式开头的数字(或其乘积)成为锚,影响了后续的估计(两个方向均严重低估真实值)。
- 任务:心算估计
锚的特性与影响强度
- 极端锚也有效:即使是明显荒谬的锚(如“甘地是否在214岁去世?”)也会影响判断(Mussweiler & Strack, 2001)。
- 常见锚的类型:
- 现状:当前状态是最常见的锚。
- 折中值/平均值:当意见分歧时,平均值常成为讨论的新锚。
- 自我产生的锚:由判断者自己回忆或计算出的初始值,其影响力尤其强(Epley & Gilovich, 2001)。
4.3 锚定效应的认知过程与解释
认知流程(图4.1)
判断是一个序列过程,包含以下主要环节(偏差可能发生在任何环节):
- 选择性注意:有限的认知资源使我们一次只能聚焦于一条信息(线索)。
- 锚定:将最初注意到的凸显值作为判断起点。
- (不充分)调整:根据后续信息进行修正,但调整幅度通常不足。
- 形成最终判断。
该过程自然导致首因效应:最先考虑的信息被赋予过高权重。
偏差产生的双重机制
- 调整不足的保守性:当新信息出现时,人们只对初始估计进行微小调整,而非彻底修正。
- 选择性可及性:锚会激活记忆中与之相容的信息,使后续判断出现偏差(例如,高锚使人更易想起支持高估值的信息)。
与线性模型的关系
- 锚定与调整是支持加权平均线性模型(第3章)的核心认知过程。
- 线性模型的成功部分源于人们以序列、锚定调整的方式整合信息,而线性代数能很好地近似描述这种计算过程。
4.4 锚定在现实决策中的重要影响
财务与商业决策
- 房地产评估(Northcraft & Neale, 1987):
- 研究:专业房地产经纪人评估房屋价值。
- 操纵:材料中的原始上市价格在真实市场价上下浮动12%。
- 结果:上市价格显著影响了经纪人的评估和市场售价建议,尽管他们声称能识别出5%以上的偏差。
- 随机锚与支付意愿(Ariely, Loewenstein, & Prelec, 2003):
- 研究:学生为商品(葡萄酒、书等)出价。
- 操纵:出价前,先让学生看自己社保号后两位(一个随机数),并问是否愿以该价格支付。
- 结果:社保号后两位与学生出价呈正相关(r≈0.40)。社保号大的学生出价显著更高。
- 概念:这种由随机锚导致的需求一致性被称为“随机一致性”。
司法判决
- 损害赔偿(Hastie, Schkade, & Payne, 1999):
- 模拟审判:原告要求的赔偿额(1500-5000万 vs. 5000万-1.5亿)直接影响陪审团判决的中值(分别为1500万和5000万)。
- 结论:“要的越多,得到的越多”,即使法官已指示该要求仅供参考。
- 保释金设定:检察官的建议金额对法官设定保释金有重大影响,有时甚至成为唯一依据(Dhami & Ayton, 2001)。
偏好反转与“钱泵”
- 研究(Slovic, Fischhoff, & Lichtenstein, 1982):
- 任务:对两个期望价值相近的赌博游戏进行出价和选择。
- 赌博A:高收益($16),低概率(11/36)。
- 赌博B:低收益($4),高概率(35/36)。
- 结果:
- 出价时:人们为赌博A出价更高(锚定在收益金额)。
- 选择时:更多人选择赌博B(锚定在赢钱概率)。
- 现象:偏好反转——同一人在不同任务下表现出不一致的偏好。
- “钱泵”悖论:
- 理论上,主试可以循环利用这种不一致(按高价卖给被试A,用B换回A,再按低价买回B),像水泵一样抽取被试的钱。
- 即使被试意识到这一点,仍会做出不一致的选择,评论如:“我知道这么做是愚蠢的……但是我确实喜欢这个。”
4.5 自我锚定与社会判断
自我中心投射
- 定义:在推断他人的想法、感受或行为时,以自身的反应为锚,再根据感知到的他人与自己的差异进行调整。
- 理论基础:
如果你足够机智冷静,那么你可以坐在摇椅上,通过不断自问自己会有哪些反应来预测人们是如何反应的。如此一来,你会得到大量免费的实验样本。——托马斯·谢林 (1966)
“虚假共识效应”及其争论
- 经典研究(Ross, Greene, & House, 1977):
- 任务:询问大学生是否愿意挂“忏悔”牌子在校园行走,并估计有多少比例同学会做同样选择。
- 结果:
- 愿意者估计:63% 的同行者。
- 不愿者估计:23% 的同行者。
- 结论:人们高估他人与自己观点或行为的一致性,即“虚假共识效应”。
- 适应性 vs. 偏差:
- 适应性观点:在缺乏信息时,以自我为锚是推断他人的一个合理的启发式,因为人们之间本就存在相当程度的相似性。
- 偏差观点:只有当人们在统计上过度依赖自我锚,权重超出合理范围时,才构成真正的认知偏差(Dawes, 1989)。证据不一。
视角采择的困难
- 研究(Epley等, 2004):指令发出者难以考虑接收者能看到被遮挡物体的不同视角,沟通协调失败。
- 讽刺理解:理解讽刺信息时,人们先锚定于字面意思(首次解释),需要额外努力才能调整到真实含义。
4.6 记忆的锚定与回顾性偏差
记忆受当前状态锚定
- 原理:回忆过去时,我们以当前的信念、态度和感受为锚,对模糊的记忆痕迹进行重建,导致记忆出现系统性偏差,更接近现状而非历史真实。
- 态度回忆偏差(Markus, 1986):
- 纵向研究:追踪调查受访者1965、1973、1982年的政治态度,并在1982年让其回忆1973年的态度。
- 发现:回忆的1973年态度与1982年当前态度高度相似,而与实际记录的1973年态度相差甚远。模型显示,回忆几乎完全由当前态度驱动。
- 行为回忆偏差(Collins等, 1985):
- 研究:追踪学生吸烟、饮酒行为。
- 发现:当前饮酒量增加的学生,会高估自己过去的饮酒量(反之亦然),忽略了实际发生的变化。
对变化的普遍性失察
- 人们倾向于认为自己的态度或行为比实际情况更稳定。
- 文化刻板印象(如“人越老越保守”)也会扭曲对自身变化的回忆。
毛毛虫变成蝴蝶之后,习惯性地认为它们在年幼时便已经是小蝴蝶。成熟让我们所有人变成了说谎者。——乔治·瓦利恩特 (1977)
第5章:启发式判断——可得性与代表性
5.1 引言与启发式概述
我们认为自己与猿类的区别在于我们拥有思考的能力。但是我们不曾记得,这种能力只类似于一岁孩童的行走能力。我们的确在思考,但是却思考得如此糟糕,以至于我时常感觉,也许我们不去思考反而更好。——伯特兰·罗素
本章主旨
- 本章探讨支撑人类判断的两种基本认知启发式:可得性与代表性。这些是近乎自动化的能力,用于推断频率、概率和数量。
- 启发式:一种高效但可能不精确的解决问题或进行判断的心理捷径。
- 启发式源于基本认知能力(相似性评估、记忆提取、因果识别),是在经验中习得的认知工具。
启发式的性质与作用
- 来源:来自于数学与计算机科学,与算法(精确但可能低效)相对。
- 功能:告诉我们在环境中选择什么信息以及如何整合信息,以推断无法直接感知的事物。
- 特点:
- 通常快速、省力,在多数日常情境下有效。
- 但有时会造成严重的系统性错误(偏差)。
- 核心机制:当判断对象(频率、概率、数量)难以直接评估时,我们会将其替换为一个更简单、更自动化的评估问题(如“这件事有多容易想起?”或“它有多像某个典型?”)。
5.2 估计频率和概率:基础能力与偏差
基于记忆的频率估计
- 人类拥有天生的频率估计能力,知觉和记忆系统会自动记录事件。
- 心理物理函数:当基于记忆估计事件频率时,主观估计与客观频率之间存在系统性偏差:
- 对于低频事件:主观估计倾向于高估。
- 对于高频事件:主观估计倾向于低估。
- 例证:对致命事件(如心脏病、车祸、自杀)发生频率的估计呈现出先高估、后低估的“回归”模式(图5.1)。
即时评估 vs. 记忆评估
- 即时评估(如快速瞥见少量物体):对1-5个项目可精确估计(“理解范围”)。
- 工作记忆局限:超过约7个项目时,需采用更审慎的策略,并开始出现低估倾向。
5.3 可得性启发式
定义与流程
- 可得性启发式:依赖信息从记忆中提取的便捷性(流畅性) 来判断频率或概率。
- 判断流程(图5.2):
- 获取与存储信息。
- 保持与遗忘。
- 情境再认。
- 探测记忆(提供线索)。
- 提取或激活匹配信息。
- 评估提取便捷性(基于数量、速度、生动性)。
- 基于感知到的便捷性做出最终判断。
偏差来源
- 流程中多个环节可能引入偏差:
- 存储样本有偏:记忆中的事件样本本身不具代表性。
- 记忆线索有偏:提取线索导向特定信息。
- 事件的凸显性/生动性差异:某些事件更突出,主导提取过程。
5.4 记忆中的有偏样本
媒体效应与社会认知偏差
- 案例:自杀 vs. 谋杀:多数人认为谋杀更常见,但统计数据(及自杀漏报)表明自杀更多。
- 解释:谋杀得到媒体更多报道,因此在记忆中更“可得”。
- 研究:对各种死因的频率估计与其媒体报道频率高度相关,而非与实际发生率(飞机失事、恐怖袭击被高估;中风、胃癌等被低估)。
- 其他偏差:
- 精神病与犯罪:媒体只报道罪犯的精神病史,导致人们高估精神病人犯罪比例。
- 种族与犯罪:媒体报道过度关注少数族裔罪犯,实验显示人们更容易“认出”非裔美国人名字为罪犯(即使名单中无罪犯)。
- 罕见特征的凸显:具有罕见特征(如左撇子、特定种族背景)的个体因其独特性更容易被记住和编码,导致对其群体比例的高估。
非理性概括
- 人们容易从单一、非典型事件进行过度概括(归纳逻辑),而从一般规律到具体个案的推理(演绎逻辑)则应用不足。
一个年轻女士跟我说:“与毛皮商打交道时我经历了最可怕的事情……他们全部是犹太人。”但是,为什么她选择去仇恨犹太人而不是毛皮商呢?——萨特 (1948)
5.5 记忆抽样偏差
提取过程本身的偏差
- 案例:单词判断(Tversky & Kahneman, 1974):
- 问题1:有多少6字母单词以
_ _ _ _ n _结尾? - 问题2:有多少6字母单词以
_ _ _ ing结尾? - 结果:人们认为以
-ing结尾的单词更多。 - 逻辑:所有以
-ing结尾的6字母单词第5位都是n,但反之不成立。实际上前者数量更多。 - 解释:提取
-ing单词更容易(更可得),导致判断偏差。
- 问题1:有多少6字母单词以
- 迷信与巧合:
- 人们相信排队总选到慢队、解说员是“乌鸦嘴”等。
- 解释:令人沮丧或巧合的事件在记忆中更突出、更容易提取,而平淡或无关的事件则不易记起。
- 巧合在个人经历中罕见,但在大量人群的经历中普遍(阿尔瓦雷斯,1965)。
生动性效应
- 研究:在模拟酒后驾驶审判中,将起诉方或辩护方的证据以生动(细节丰富)或贫乏的方式呈现(Reyes, Thompson, & Bower, 1980)。
- 结果:使用生动证据的一方在裁决中占优,尤其是在延迟裁决后(记忆优势更明显)。
- 应用:律师使用“示意证据”给陪审团留下深刻印象,正是利用可得性偏差。
情绪一致性效应
- 当处于特定情绪状态时,更容易回忆起与当前情绪主题一致的事件,进而影响基于记忆的判断。
- 研究:
- 听到引发焦虑新闻的被试,会给出更高的风险评估(Johnson & Tversky, 1983)。
- 通过催眠诱导高兴/悲伤情绪,被试认为与情绪一致的事件更可能发生(图5.3)。
5.6 想象可得性
想象的便捷性影响判断
- 定义:不依赖实际记忆,仅凭想象的难易程度来判断可能性或频率。
- 案例:
- 家庭威胁:想象孩子玩枪出事比想象孩子溺于泳池更容易,可能高估前者的风险。
- 组合问题:从10人中选2人成组 vs. 选8人成组,人们感觉前者更容易,因此判断组合方式更多。
- 逻辑:两者组合数相等(选2人即自动生成一个8人组)。
- 启示:想象的便捷性受实际频率之外的因素影响,可导致频率和概率估计偏差。
5.7 从可得性到概率和因果关系
次可加性与超可加性
- 次可加性:对一个互斥且穷尽的事件集合中的各子事件进行单独概率估计时,其概率之和大于1。
- 研究:医生估计病人四种预后结果的概率,单独估计之和为1.64(Tversky等)。
- 解释:对每个子事件的描述(如“死于住院期间”)提供了生动的想象线索,而互补事件(“未死于住院期间”)缺乏具体线索,导致每个子事件都被高估。
- 超可加性:整体事件的概率估计大于其各子部分概率之和。
- 发生条件:当子成分难以想象或回忆时。
- 解释:“反向提取困难效应”——难以考虑的子事件被判断为更不可能。
现实案例:外星人绑架与个人贡献
- 外星人绑架信念:一道调查问题提及“醒来感觉有陌生人”,显著提高了人们报告此类“经历”的比例(40% vs. 14%),支持了次可加性的解释(描述提供了提取线索)。
- 团队贡献评估:团队成员个人贡献估计之和远超100%,无论是积极还是消极贡献(Ross & Sicoly, 1979)。与回忆具体事例的能力相关,表明记忆可得性是原因之一。
次可加性等效应表明,对事件的描述方式(“解压缩”)通过影响认知可得性,能显著改变人们的概率判断,进而影响公共资源分配和政策制定。
5.8 代表性启发式
核心思想与案例
- 代表性启发式:根据客体或事件与某个范畴原型的相似性来进行分类或概率判断。
- 关键问题:过度依赖相似性,忽略基准概率和逻辑结构。
案例1:佩内罗珀的专业
- 描述:一个符合“艺术史学生”刻板印象的大学生。
- 判断:多数人判断她主修艺术史。
- 基准概率忽略:实际上,心理学专业的学生数量远多于艺术史专业(基准概率约150:1)。
案例2:律师-工程师问题(Tversky & Kahneman, 1974)
- 任务:根据简短描述判断某人是工程师还是律师,已知群体中工程师/律师的比例(70/30 或 30/70)。
- 结果:描述信息完全压倒基准概率信息。即使描述无信息量,判断仍为50/50,而非遵循基准概率。
- 相关性:概率判断与“相似性”评估的相关高达 0.95。
案例3:琳达问题(合取谬误)
- 描述:琳达是一位关心社会正义、参加过反核示威的单身女性。
- 任务:判断概率: A. 琳达是银行出纳员。 B. 琳达是银行出纳员并积极参与女权运动。
- 结果:86% 的人认为B的概率更高。
- 逻辑错误:B是A的一个子集,其概率不可能高于A。这被称为合取谬误。
我知道出现在交集处的可能性极小,但是我脑子里一直有个小人在上蹿下跳地大喊大叫——‘仔细阅读那段描述,她不可能只是一位银行出纳员’。——斯蒂芬·杰伊·古尔德 (1991)
5.9 “代表性”思维及其问题
认知模型
- 概念表征:类别在头脑中以属性列表(包括典型、相关但非定义性属性)方式表征。
- 相似性判断:常用“对比模型”,快速比对两个实体的匹配与不匹配属性。
- 判断流程(图5.5):从刺激到激活类别原型,比较相似性,忽略基准概率,最终输出概率判断。
代表性思维的陷阱
- 忽略基准概率:不关心类别在总体中的基础发生率。
- 忽略逻辑结构:如琳达问题中的集合包含关系。
- 引发不当联想:一旦归类,会激活关于该类别的其他联想(可能是负面刻板印象)。
- 现实案例:入学委员会因申请人拼错“工程学”单词而联想到“阅读障碍”;因申请人提到星座而联想到“占星术疯子”。这些联想忽略了“非阅读障碍者”和“非怪人”的基准概率更高。
代表性思维的本质问题是:相似性并不反映潜在的统计和因果结构。
5.10 条件概率的混淆与比例规则
比例规则:理清条件概率关系
- 问题核心:人们常混淆 p(特征|类别) 与 p(类别|特征),即混淆了“类别成员具有某特征的概率”与“具有某特征的人属于该类别的概率”。
- 数学关系(贝叶斯定理基础):
p(S|c) / p(非S|c) = [p(c|S) / p(c|非S)] * [p(S) / p(非S)]- 其中 S 代表类别,c 代表特征。
- 逆反概率的比率取决于简单概率的比率和基准概率的比率。
现实中的混淆案例
- 辛普森案:德肖维茨称“殴打妻子的男人中只有0.1%会杀害妻子”
p(谋杀|殴打)。但相关概率应是p(丈夫谋杀|丈夫殴打且妻子被杀),统计学家古德计算后者可能高达1/2或1/3。 - 大麻与硬性毒品:标题“大部分吸食大麻者还使用其他致瘾药物”声称
p(硬性毒品|大麻)高。但研究实际表明p(大麻|硬性毒品)高。两者因吸食大麻者远多于吸食硬性毒品者,而截然不同。 - 驾驶安全:“大部分死亡事故发生在离家25英里内”
p(死亡|近距离驾驶),被误推为“离家越远驾驶越安全”p(近距离驾驶|死亡),忽略了在近距离驾驶的概率本身很高。 - CEO与宠物:94%的CEO童年养宠物,就推断养宠物导致成功
p(宠物|CEO),但需要知道p(CEO|宠物)或养宠物孩子的基准概率。 - 心理学与自尊:布兰登声称所有心理问题都源于低自尊
p(低自尊|心理问题)高,就推断低自尊导致心理问题p(心理问题|低自尊)高,忽略了低自尊人群的基数可能很大。
何时会考虑基准概率?
- 具有因果意义时:当基准概率能被赋予因果解释(如公交公司因管理不善导致事故率高),人们更可能使用它。
- 赤裸的统计数字:缺乏因果意义的基准概率常被忽略(如DNA统计证据在法庭上说服力有限)。
- 具体频率 vs. 抽象概率:人们更擅长用具体数字和频率而非抽象比例进行推理。
逃离由“现成性”主导的思维,去思考经验中不明显的关系,需要意志力和训练。
第6章:基于解释的判断——故事、合取谬误与后见之明
6.1 引言:人类作为讲故事的灵长类
千百年来,也许数百万年来,人类彼此讲述着故事。……人类在不停地讲故事,是因为那些故事都是他们不得不去讲述的故事。——罗杰·尚克 & 罗伯特·埃布尔森 (1995)
- 核心观点:人类通过构建情境模型或故事来理解和判断世界。故事将事件通过因果关系(尤其是以目标为导向的人类动机)串联起来,形成连贯、有说服力的叙事。
- 基本特征:故事建构是一种近乎自动化的认知能力,是总结过去、预测未来的主要认知格式。
6.2 合取概率谬误
定义与经典案例
- 合取概率谬误:错误地认为多个事件联合发生的概率,大于其中任何一个独立事件发生的概率。
- 本质:这是一种逻辑错误,因为多个事件同时发生的概率(联合概率)必然小于或等于其中任一事件的概率。
- 案例1:酗酒的网球明星
- 问题A:一个酗酒的网球明星赢得8个月后锦标赛的概率。
- 问题B:一个酗酒的网球明星参加戒酒协会并戒酒成功后,赢得8个月后锦标赛的概率。
- 结果:多数人认为B(联合事件)的可能性更大。
- 逻辑:赢得锦标赛的途径很多(如自己戒酒、运气好等),因此单独“赢得锦标赛”的概率必然高于“戒酒且赢得锦标赛”这一特定路径的概率。
- 案例2:P先生的身份(Tversky & Kahneman, 1983)
- 任务:根据一份描述(曾是走私犯,正被调查),对P先生可能的罪行按概率排序。
- 关键对比:
- 选项A:P先生杀害过一名雇员。(平均排序:3.17)
- 选项B:P先生杀害过一名雇员,以阻止其报警。(平均排序:2.9)
- 结果:增加了特定动机(“为了…”)的联合描述,被认为比单纯的谋杀更可能发生。
- 案例3:医疗诊断(Tversky & Kahneman, 1983)
- 任务:医生评估肺动脉栓塞患者同时出现两种症状的概率。
- 结果:91% 的医生认为,两种症状(如“呼吸困难”和“不太可能的症状——偏瘫”)联合出现的概率,高于单独出现那个“不太可能”症状的概率。
- 解释:两种症状的结合在医生心中形成了一个更合理、更连贯的“解释”。
合取谬误表明,一个情节连贯、解释力强的“好故事”会使人高估其真实发生的概率。
6.3 从解释到判断的逻辑
为什么“好故事”会误导判断?
人们构建和相信连贯故事的过程,会导致对概率的高估(图6.1)。主要原因有三:
-
概率的乘法效应被忽视:
- 数学事实:多个独立事件联合发生的概率等于各自概率的乘积(
p1 × p2 × … × pk)。 - 心理现实:人们评估时,往往被其中“有代表性”的单个事件的较高概率所锚定,并进行不充分的向下调整,导致最终估计远高于真实概率。
- 示例:即使每个事件概率都高达0.8-0.9,六个事件连续发生的真实概率可能只有0.37,但人们仍会高估。
- 数学事实:多个独立事件联合发生的概率等于各自概率的乘积(
-
想象力的影响:
- 对整体事件的生动想象,会使人更相信联合事件比独立事件更可能发生。
- 示例:P先生为特定动机杀人,比他为任何动机杀人更容易在脑海中形成具体情景。
-
可得性偏差的强化:
- 戏剧性的、巧合的联合事件更易被关注、谈论和记忆,从而在认知上更“可得”,进一步放大了对其发生概率的高估。
6.4 司法情景:最好的故事胜诉
陪审员决策的故事模型
- 核心假设:陪审员通过构建故事来整合证据、理解案件,故事与裁决选项的匹配度决定最终判决(图6.3)。
- 研究证据(Pennington & Hastie, 1991):
- 陪审员会依据自己对证据的理解,构建一个按时间顺序排列的因果故事(图6.2)。
- 不同裁决(如有罪/无罪)对应着截然不同的故事版本。
- 故事越完整、具体、独特,陪审员对该裁决的信心越强。
故事的影响力:呈现顺序与种族因素
-
证据呈现顺序效应:
- 实验:操纵原告与被告的证据呈现顺序。
- 故事顺序:按事件发生的时间顺序呈现。
- 目击者顺序:按审判中目击者出庭的顺序(混乱)呈现。
- 结果:当原告使用故事顺序而被告使用目击者顺序时,78% 的陪审员判定有罪;反之,只有31% 判定有罪。
- 结论:能以“故事顺序”更好构建叙事的一方,在裁决中占据巨大优势。
- 实验:操纵原告与被告的证据呈现顺序。
-
种族与故事可信度:
- 辛普森案分析:非裔美国人比欧裔美国人更可能相信“种族主义警察伪造证据”的故事。
- 解释:个人的生活经历、背景信念(如对司法系统不公平的体验)会影响其对特定故事版本的接受度。
法律策略的启示
- 最佳策略:在开场陈述中就提出一个连贯、可信的故事框架,引导陪审员依此解读后续证据。
- 警示:提出一个糟糕的辩护故事,可能比不提故事更不利。
- 因果推断:陪审员常使用“反事实思维”(“如果……那么……”)来检验因果关系,这成为故事构建的关键部分。
6.5 有关我们自身的情景:生活叙事与心理治疗
叙事性事实
- 观点:在心理治疗中,来访者对其生活的叙述方式是理解问题的关键。
- 治疗目标:帮助来访者重构一个更具适应性、更合理的生活故事,即使这与历史真相不完全一致。
- 弗洛伊德后期意识到,关键“病因”事件可能并未发生,但重构故事仍有助于治疗。
- 潜在问题:这种重构可能导致来访者将生活发现视为对“真实”自我的发现,而非一种有益的创造,从而可能形成自我限制的归因(如“我就是个自恋狂”)。
记忆为故事服务
- 自传体记忆会受当前态度、信念和情绪影响,为维护一个连贯的自我叙事而被重构。
- 我们可能从文化原型、家族神话中提取元素,来实现预设的“生活脚本”。
6.6 难以想象的情景与概率思维
情景思维的局限性
- 问题:生动的、具体的因果故事(如“地震引发洪水致死千人”)会让人高估其发生概率,而低估更宽泛、更可能事件(如“任何原因导致洪水致死千人”)的概率。
- 本质:这仍是合取概率谬误——具体故事的逻辑概率更低,但心理概率却被抬高。
案例:核战争风险
- 生动但片面的情景:人们容易聚焦于少数几个生动的核战触发情景(如恐怖分子偷运核弹),并错误地认为只有这些特定情景才会导致核战。
- 理性的概率思维:
- 应系统考虑所有可能路径的长期概率。
- 微小概率变化具有巨大长期价值:假设每年核战概率从0.02降至0.0133(降低1/3),则未来40年无核战的概率从0.44升至0.58——这个差异在生死攸关的决策中至关重要。
- 核心信息:
理性分析要求对情境和可能结果进行系统全面的表征,以便评估事件发生的重大潜在概率。……与陷进一些少数几个扣人心弦的情景细节相比,概率评估更加有效。
6.7 后见之明:对过去的重构
后见之明偏差
- 定义:在知道事件结果后,人们会错误地高估自己原先预测到该结果的可能性,并认为该结果本就“不可避免”。
- 别称:“渐进决定论”——事后看来,事情的发生似乎是注定的。
关键研究与证据
- 经典实验(Fischhoff, 1975):人们在知道事件(如尼克松访华)结果后,回忆自己事前的预测时,会产生偏向实际结果的偏差。
- 因果关系的作用(Wasserman, Lempert, & Hastie, 1991):
- 后见之明偏差主要发生在人们能为结果构建出有说服力的因果解释时。
- 如果结果被归因于意外、无因果联系的事件(如反常风暴),则偏差减弱。
- 现实案例:水门事件录音带(Neisser, 1981):
- 对比约翰·戴恩的证词与尼克松的秘密录音,发现戴恩的记忆虽详细但存在偏差,其证词更符合他作为证人时的情境,而非事件原貌。
- 信念扭曲记忆(Conway & Ross, 1984):
- 研究:参加(无效的)学习技能项目的学生。
- 结果:项目后,这些学生回忆自己项目前的技能比实际报告更差。
- 解释:他们重构了记忆,以使其与“项目应能提高技能”的信念相一致,从而“证明”了项目的“效果”。
- 心境与童年记忆(Lewinsohn & Rosenbaum, 1987):
- 发现:当前抑郁的人更倾向于将父母回忆为“排斥、无爱心”。
- 抑郁治愈者与从未抑郁者的回忆无差异。
- 挑战:这表明成年心理问题与痛苦童年记忆的关联,可能部分源于当前痛苦心境对记忆的偏差性重构,而非真实的童年经历。
6.8 有些时候最好还是忘却
- 为了保持对当前情境的有效心理模型,我们需要不断更新和调整认知。
- 这一过程虽然具有适应性(帮助我们面向未来决策),但会导致我们难以准确回忆过去的所思所行。
- 从决策角度看,忽略沉没成本、聚焦未来是理性的,而这通常意味着“遗失过去”在某种程度上是件好事。
第7章:偶然与因果——误解随机性与因果幻觉
7.1 引言:人类对偶然性的核心困境
假设你正在想着一盘虾,突然就有人提到了盘子,或者虾,或者一盘虾。完全出乎意料,也没法找到一个理由。这就是一种巧合,巧合存在于所有的事物之中。——摘自电影《报信的人》(1984)
- 核心困境:人类的大脑不擅长对偶然性和不确定性进行系统推理。我们倾向于对随机事件过度解释,即便明白其本质不可预测,仍会产生奇异的想法和迷信观念。
- 概率论的作用:概率论是描述世界不确定性的技术语言,学会它能极大改变世界观。但未经训练,人们看待世界是因果式的,而非概率式的。
- 偶然性的本质(庞加莱观点):日常所说的“偶然”、“随机”事件,其背后物理过程通常是确定的。我们称其为随机,仅是因为其因果关系隐蔽、复杂而不为人知。
- 例证:
- 维斯娜·瓦洛维奇:从万米高空坠毁的航班中奇迹生还。
- 外界看法:既是“千载难逢的倒霉”(遇上恐袭),又是“千载难逢的幸运”(生还)。
- 本人看法:“我并不幸运……如果我真的幸运,就根本不会遇上这样的事故。”
- 分析:她的幸存在物理上必有确定原因,只是我们信息不足,故视作“奇迹”或偶然。
- 维斯娜·瓦洛维奇:从万米高空坠毁的航班中奇迹生还。
7.2 控制错觉
定义与核心实验
- 控制错觉:人们倾向于将偶然事件视为与技巧有关,从而相信自己能对其施加控制。
- 关键研究(Ellen Langer, 1975):
- 彩票实验:
- 设计:被试获得一张印有橄榄球员的彩票。一组自选球员,一组随机分配。中奖概率相同。
- 结果:当实验者提出购买彩票时,自选组被试的要价平均是随机组的4倍。
- 结论:自由选择增强了“控制感”,尽管它不影响实际概率。
- 抛硬币预测实验(Langer & Roth, 1975):
- 设计:让耶鲁本科生预测抛硬币结果,给予虚假反馈(30次对15次),但操纵前期/后期正确次数。
- 结果:
- 前期正确多的被试认为自己的预测能力“在平均水平之上”。
- 超过25% 的被试报告表现会受分心物干扰,40% 认为可通过练习提高。
- 结论:人们相信预测随机结果是一种可培养、可干扰的“能力”。
- 彩票实验:
现实影响与后果
- 商业利用:赌场和彩票设计欺骗性的技巧元素(如自选号码、使用体育术语),以强化玩家的控制错觉。
- 交通选择偏好:
- 现象:人们偏爱开车而非坐飞机,部分源于认为开车“更有控制感”。
- 风险事实:一次越洋飞行的死亡概率约等于开车20公里。
- 悲剧后果:据估计,“9·11”后因改驾车出行而额外导致了约 1,500人死亡(Gigerenzer, 2006)。
- 金融投资表现:
- 研究(Fenton-O‘Creevy等, 2003):投资银行交易员玩一个指数变动完全随机的游戏。
- 结果:
- 交易员普遍存在控制错觉(认为自己能影响随机指数)。
- 控制错觉程度与绩效呈负相关:错觉强的交易员收入少约10万美元,对银行利润贡献更少,上司评价也更低。
7.3 看到不存在的因果结构
对随机序列的错误直觉
- 问题根源:我们对随机性的朴素概念包含过多的交替变化。当面对真正的随机序列时,会因其“看起来不够杂乱”(交替少于预期)而断定其为非随机。
- 代表性思维作祟:我们依赖对随机过程的刻板印象(认为小样本必须“代表”总体比例)进行判断。
具体表现与案例
- 赌徒谬误:
- 定义:认为如果一个独立随机事件很久未发生,那么它“发生的时机就成熟了”。
- 示例:抛硬币连续8次正面后,人们感觉第9次出现反面的可能性更大。
- 逻辑:硬币无记忆,每次抛掷独立,概率恒定。
- “祸不单行”与空难分析:
- 普遍信念:空难会“扎堆”发生。
- 数据分析(Vaught & Dawes):1950-1970年空难间隔天数完美符合p值恒定的随机模型。随机序列本身就会产生“扎堆”,但人们会错误推断背后有因果(如“势头”)。
- 篮球“热手”现象:
- 定义:认为球员一次命中后,再次命中的概率会暂时提高(一种正反馈)。
- 经典研究(Gilovich, Vallone, & Tversky, 1985):分析费城76人队等球队数据,未发现热手效应。球员某次命中后再次命中的概率与投失后命中的概率无差异。
- 调查:90%以上的篮球运动员和体育记者相信热手效应存在。
- 后续分析(Koehler & Conley, 2003):分析NBA三分球大赛数据,即使考虑解说员提到的“热手”,也未发现非随机模式。
- “微波炉”文尼·约翰逊案例:有研究称发现其非随机模式,但复核原始录像发现数据记录错误,纠正后其表现仍符合随机模型。
- 出生顺序的误解:
- 实验(Tversky & Kahneman, 1974):让人们估计不同生育顺序(如“女男女男男女” vs “男男男女女女”)的家庭数量。
- 结果:80%以上认为交替多的序列更常见。
- 事实:所有特定顺序的概率完全相同(
(1/2)^6)。 - 解释:交替多的序列“看起来更随机”,符合人们对随机性的错误刻板印象。
- 伦敦轰炸地图(图7.1):
- 现象:二战时伦敦市民从V-1/V-2导弹落点图中看到了“集中打击区”。
- 解释:市民推断德军有意避开间谍藏身处。
- 数学分析:落点分布与随机泊松过程完全一致,不存在系统性意图。
- “癌症集群”癔症与德州神枪手谬误:
- 现象:社区癌症发病率异常升高,引发环境归因和公共调查。
- 统计事实:在随机模型中,局部地区癌症发病率“异常高”是普遍现象。例如,加州有80种癌症,在5000个普查区中,超过2750个区至少有一种癌症发病率会“统计上显著过高”。
- 调查结果:成千上万的“热点追踪”调查,几乎无一明确指向环境因素。
- 德州神枪手谬误:先射击(事件发生),后画靶心(寻找解释)。这会导致浪费公共资源并错误建立关联。
- 现实案例:马萨诸塞州沃本恩白血病集群,最终也未发现污染物与癌症间的可靠因果关系。
人们极易从随机数据中“看到”模式,并构建因果解释,而忽略这些模式完全可能(且经常)是随机波动的结果。
7.4 趋均数回归
概念与统计必然性
- 定义:在两个不完全相关(相关系数小于1)的变量中,对其中一个变量的极端值进行预测时,另一个变量的预测值会趋向于平均值,而非同样极端。
- 统计必然性:只要两个变量不是完全相关,回归就会发生。它是所有不完全相关关系的内在属性。
- 发现者:弗朗西斯·高尔顿(1886),命名为“后代趋中回归”。
机制解释(图7.2)
- 以父亲与儿子身高为例。高个父亲群体的儿子平均身高仍高于常人,但低于其父亲的平均身高。反之,高个儿子的父亲平均身高也低于儿子。
- 原因在于身高并非完全遗传(相关非1),存在变异。因此,极端组的配对值会向均值“回归”。
- 回归程度指标:
回归 = 完全相关(1) - 实际相关系数。相关系数越低,回归效应越强。
忽略回归导致的错误判断
- 《体育画报》封面厄运:
- 现象:登上封面的运动员或球队随后表现下滑。
- 解释:登上封面是因为取得了极端优异的成绩,随后表现向平均回归是统计必然,无需“骄傲”、“分心”等特殊解释。
- 商业中的“卓越”陷阱:
- 《商业中庸才的胜利》(赛克雷斯特,1933)与**《追求卓越》**(彼得斯和沃特曼,1984):挑选当时极端成功的公司总结成功秘诀。
- 后续:这些公司业绩随后普遍下滑(《商业周刊》,1984)。
- 本质:选择了极端值,随后观察到向均值的回归,误以为是管理因素导致的变化。
- 飞行教官的教训(Tversky & Kahneman, 1974):
- 情境:教官表扬出色表现后,学员下次往往变差;斥责糟糕表现后,学员下次往往进步。因此教官认为惩罚比奖励更有效。
- 真相:这是纯粹的回归效应。极端好表现后会自然回归(变差),极端差表现后会自然回归(进步)。奖励与惩罚的效果被回归假象混淆。
- 解雇教练/CEO的“效果”:
- 情境:球队或公司表现极差时解雇领导,随后表现改善。
- 问题:无法区分是领导更换的作用,还是从极端差表现向均值回归的作用。
- 分析:谨慎的统计分析表明,大部分改善可归因于回归效应。
- 临床评估的陷阱:
- 错误做法:直接比较病人治疗前后分数(如MMPI量表)。
- 后果:最初症状最严重的病人,因回归效应,改善分数可能最高,从而被误判为“治疗最有效”。
- 正确做法:应基于前测分数与常模的相关性,做出回归预测,然后将后测实际分数与预测值比较。
在评估任何针对极端表现(好或坏)的干预措施效果时,必须将趋均数回归效应考虑在内,否则极易得出因果关系的错误结论。
7.5 反思与结论
- 普遍性:从赌徒到球迷,从企业家到临床医生,人们普遍难以接受随机性,倾向于看到不存在的控制和因果结构。
- 核心信息:应对这些根深蒂固的非理性习惯的良方是——像一个概率理论家那样思考。在面对不确定性和判断极端事件时,主动运用概率思维,警惕控制错觉、模式幻觉和回归效应。
第8章:理性思考“不确定性”——克服偏差与概率思维的应用
当今的逻辑学只擅长于分析确定的、不可能的或完全不确定的事情,而这三类事情其实都没有分析的必要(谢天谢地)。因此,这个世界真正的逻辑在于概率计算过程,即一个理性者头脑中认为概率是多大,或应该多大。——詹姆斯·克拉克·麦克斯韦
8.1 引言:面对偏差,我们该怎么办?
- 核心困境:自动化思维导致的认知偏差(如代表性、可得性、锚定等)会将判断引入可预知的歧途。
- 基本观点:系统的理性分析是克服直觉偏差的最佳方法,而概率论和统计学是组织此类思维的核心工具。
-
概率论本质上只是一些计算方面的常识。——拉普拉斯(但作者认为此观点是错误的,概率思维并非天生)
-
- 关键策略:像尤利塞斯一样采取预防措施(预见到自身弱点并主动约束)。
- 利用外部帮助:记录数据、使用公式图表、计算基础概率。
- 自我施加外部约束:增加判断自由度,从可预见的内部限制(情感/认知)中解脱。
- 警惕专家直觉:在已有外部预测(如统计模型)时,依靠直觉进行“改进”往往会使结果更糟。
8.2 开始用概率来思考:方法论
从“内部观点”转向“外部观点”
- 内部观点:决策者倾向于强调每个问题的独特性,陷入具体情境细节。
- 外部观点:将当前问题视为一系列类似问题中的一个,从整体分布和概率角度思考。
- 经典案例:课程设计项目(Kahneman & Lovallo, 1993)
- 内部估计:团队成员估计项目还需18-30个月完成。
- 外部观察:专家回顾类似项目,发现约40%会放弃,完成者则需7-10年,且当前团队资源低于平均。
- 启示:外部视角的基础概率信息能显著纠正过于乐观的内部估计。
概率思维的基本要素与四种情境
定义事件关系(以掷骰子为例):
- 简单事件:掷出一个1。
- 合取事件:同时掷出1和6。
- 析取事件:掷出1或6(或两者)。
- 条件事件:已知点数和为7,其中一个骰子是1的概率。
用概率描述的四种情境:
- 理想随机情境(如骰子、扑克):可通过逻辑分析推断概率。
- 定义明确的实证情境(如大学生特征):可通过统计频率计算概率。
- 中等明确的情境(如总统大选预测):难以获得精确频率,但可系统列出相关事件和样本空间,进行因果推理。
- 大量未知的情境(如未来国际冲突):样本空间都难以建构,但系统分布表征仍优于直觉判断。
判断错误常始于对情境的错误理解(表征)。建立有效的外部表征(图示、符号)是理性分析不确定性的第一步。
8.3 理解判断的情境:挑战与工具
问题表征的模糊性:两个经典难题
- 三张卡片问题(Bar-Hillel & Falk, 1982):
- 问题:三张卡(红-红、白-白、红-白),随机抽取一张且红面朝上,问该卡是“红-红”的概率。
- 典型错误答案:
1/2(认为排除了“白-白”,只剩两种可能)。 - 正确答案:
2/3。 - 错误根源:基于“整张卡”表征问题(剩两张)。正确表征应基于“卡面”(图8.1):红面朝上的等可能事件有三个(红-白的红面,红-红的两个红面),其中两个属于红-红卡。
- 三门问题(蒙提霍尔问题)(vos Savant, 1991):
- 问题:三扇门后一轿两羊。你选1号门,知情人主持人打开一扇有羊的门(如3号),问是否应改选2号门?
- 难点与争议:事件复杂性高,且对主持人行为规则的描述模糊。
- 可能的规则:
- 主持人随机打开一扇你没选的门(可能开出轿车,游戏结束)。
- 主持人总是打开有羊的门,且不选你挑的门;若你已选中轿车,则随机开另一门。
- 主持人总是打开有羊的门,且不选你挑的门;若你已选中轿车,则有偏好(如开序号小的门)地开门。
- 普遍接受的表征与答案(基于规则2):应改选。改选获胜概率为
2/3,不改选为1/3(概率树见图8.2)。
促进理性判断的工具
- 图表表征:概率树、决策树、韦恩图,能有效理清事件关系。
- 频率框架:鼓励人们基于频率而非单一事件的可能性思考,可显著减少合取谬误等错误。(例:在频率框架下,“琳达问题”的错误率从86%降至约20%)。
8.4 理性的测试:我们如何评价判断?
评价判断质量的两个标准
- 准确性(与外部标准的一致性):
- 需要可衡量的标准事件、判断者与评价者对目标认识一致、偏差代价对称。
- 基础是第3章的透镜模型。
- 内部一致性(符合逻辑与概率规则):
- 当缺乏外部标准时,通过检查多个判断间的逻辑一致性来评价理性。
- 例:认为琳达更可能是“女权主义出纳员”而非“出纳员”,违反了概率论,因而是非理性的。
- 判断错误的性质:许多错误被描述为“错觉”,因为仔细思考后人们能意识到错误,但未加控制时仍会本能地犯错。
理性评价的实践困难
- 问题表征的客观性:将现实问题转化为可应用理性原则的形式常很困难(如三门问题的模糊性)。
- 目标明确性:了解决策者的确切价值取向以定义理性标准,通常并不容易。
- 现实约束:理想化理性在信息充分、时间充裕时最优,但现实决策常在嘈杂、信息不全的环境中进行,“快而省”的启发式有时更具适应性。
8.5 如何思考逆概率:避免混淆
典型问题:乳腺癌预防性手术(McGee, 1979)
- 新闻报道:外科医生罗杰斯博士为“高风险”女性实施预防性乳房切除手术。
- 依据:放射学家沃尔夫的研究称,93%的乳腺癌在57%的高风险女性中发现。
- 医生的推理:高风险女性患癌概率很高(暗示接近50%)。
- 理性分析(使用概率树,图8.3):
- 问题混淆了
p(高风险|癌症)与p(癌症|高风险)。 - 基于报道数据计算:
p(癌症|高风险) = 71/570 ≈ 0.12,而p(癌症|低风险) ≈ 0.014。 - 结论:高风险组患癌概率仅为12%,远非“每2到3人中就有1人”,手术理由的统计基础完全无效。
- 问题混淆了
改善逆概率思维的方法
- 建立因果联系:当基础概率与结果有因果关系时,人们更可能使用它。(例:将出租车颜色比例表述为“肇事事故中15%是绿车”)
- 使用代数符号:将问题转化为概率符号并应用公式(如比例规则、贝叶斯定理)。
- 使用图表:概率树、韦恩图能直观展示关系(推荐按因果/时间顺序绘制)。
- 频率思考:想象一个具体频数(如1000名女性)并逐步推理。
8.6 避免次可加性与合取谬误
- 次可加性:对一组互斥且完备的事件概率估计之和超过1。
- 合取谬误:认为合取事件(A且B)的概率高于其组成事件之一(A)的概率,是次可加性的极端表现。
- 解决方法:
- 图表表征:用概率树或故障树(图8.4)列出所有可能原因,明确其互斥关系,自然约束概率和≤1。
- 明确提醒:口头提醒“互斥事件概率和应为1”,能有效引导更理性的推理(Van Wallendael & Hastie, 1990)。
- 韦恩图:展示集合包含关系(图8.5),直观表明“女权主义出纳员”是“出纳员”的子集,概率不可能更高。
8.7 事件的析取概率:被低估的一面
- 析取概率:至少一个事件发生的概率。对于独立事件,
p(至少发生一个) = 1 - p(全不发生)。 - 析取概率谬误:倾向于低估析取概率(与高估合取概率相对应)。
- 原因:
- 锚定-调整不足:锚定于较小的单一事件概率,向上调整不足。
- 想象力偏差:难以想象所有可能导致析取事件发生的具体路径。
- 逻辑等价性:合取谬误
p(A且B) > p(A)在逻辑上等价于析取谬误p(非A) < p(非A 或 非B),但心理上不等价。我们更易思考明确的类别(A) 而非其补集(非A)。
8.8 改变我们的想法:贝叶斯定理
经典案例:乳腺癌诊断(Casscells等, 1978; Eddy, 1988)
- 问题:40+女性乳腺癌患病率1%。X光检查对80%患者呈阳性,对10%非患者也呈阳性。问:一位阳性结果的女性,实际患癌概率?
- 医生典型答案:约75%。
- 正确答案:约7%。
- 计算(贝叶斯定理):
p(癌症|阳性) = [p(癌症)×p(阳性|癌症)] / p(阳性) = (0.01×0.80) / 0.107 ≈ 0.07(其中p(阳性) = 0.01×0.80 + 0.99×0.10 = 0.107)(概率树见图8.6)
错误根源与改进方法
- 错误根源:
- 忽略基础概率(1%的患病率)。
- 忽视“假阳性”率
p(阳性|未患癌)。 - 被证据的诊断力
p(阳性|癌症)=80%锚定。
- 改进方法:
- 使用贝叶斯公式组织思维:明确需要哪些信息(先验概率、似然率)。
- 图表表征:按因果顺序绘制概率树(图8.6, 8.7)。
- 频率思考:想象1000名妇女,逐步推算。
出租车辨色问题(Bar-Hillel, 1980)
- 问题:85%蓝车,15%绿车。目击者辨色准确率80%。目击者称肇事车为绿色,问车真是绿色的概率?
- 典型答案:0.80(忽略基础概率)。
- 正确答案(贝叶斯计算):0.41(计算见图8.7)。
- 启示:基础概率信息极易被具体的、生动的证据(目击证词)掩盖。
8.9 统计决策理论:从判断到行动
- 核心问题:在不确定条件下,基于概率判断决定是否采取行动(如是否手术)。
- 决策结果分类(以医疗诊断为例,图8.8):
- 击中:真有病,判断有病。
- 未击中(错误否定):真有病,判断无病。
- 虚假警报(错误肯定):真无病,判断有病。
- 正确拒绝:真无病,判断无病。
- 关键洞见:通过调整决策阈限(如判断患病概率达到多高才治疗),可以权衡不同类型错误的比率。
- 降低阈限→减少未击中→增加虚假警报(更多不必要手术)。
- 提高阈限→减少虚假警报→增加未击中(更多漏诊)。
- 理性决策:明确对四种结果的价值评判,选择使期望价值最大化的决策阈限。
- 政策含义:在许多领域(医疗、司法、气象),与其一味追求提高判断准确率,不如更系统、更公开地讨论我们更看重避免哪种错误,并据此设定阈限。
8.10 关于理性的总结
- 理性的局限:完全理性的思维不能保证真实结论,其输出质量取决于输入信息的有效性。
- 案例:坚信自己是“心理学实验被试”的偏执学生,虽严谨应用贝叶斯定理,但因输入的是妄想,结论仍是妄想。
- 理性的价值:区分促进/阻止特定行为的情形、有效/无效的思维方式,是社会科学的重要成就。
- 最终态度:试图掌握一切以消除不确定性往往是徒劳的。理解思维的非理性及其根源,学会在不确定性中运用概率工具做出适度优化的决策,本身就是一种重要的理性成就。
“一个人试图理解所有的事情,却往往会一无所知。”
第9章:对后果的评价——基本偏好与价值建构
你可以决定自己的口味和偏好。——佚名
9.1 引言:快乐与效用的核心概念
- 决策的终极动机:许多决策旨在追求快乐或避免痛苦。
- 效用的两种类型:
- 体验效用:实际经历某事时所感受到的快乐或痛苦的主观感觉。其产生过程常具有无意识、快速的特点。
- 决策效用:预期的满意感,即在决策时预测某种选择结果会给我们带来何种感受(Daniel Kahneman等,1997)。
- 关键应用:选择专业、伴侣、医疗方案等重大决策,都依赖于我们对结果的预期感受(决策效用)。
- “中庸之道”的心理学解释:
- 核心原理:“好的事物会使人生腻而坏的事物会逐渐升级”(Coombs & Avrunin, 1977)。
- 例证:
- 食物:最初几口带来高愉悦感和营养,之后愉悦感递减,而有害成分(卡路里等)的负面效应加速累积。
- 假期:最初的放松愉悦感会适应而减弱,同时积压的工作等麻烦带来的痛苦加速增加。
- 数学建模:当正性特征的边际效用递减(“生腻”),负性特征的边际负效用递增(“升级”),且后者变化更快时,总体验用与体验数量之间会形成单峰偏好函数,在某个适中的“理想点” 达到峰值(图9.1)。
- 个体差异:不同人的“理想点”不同(如咖啡加糖量、理想假期长度、期望子女数)。
- 神经基础:正性(快乐/多巴胺)与负性(痛苦/乙酰胆碱)评价由独立但可同时激活的神经环路处理,解释了我们对某些事物(如甜点对节食者)的矛盾反应。
对体验效用的测量与启示
- 峰-终评价原则(Redelmeier & Kahneman, 1996):人们对一段体验的整体评价,主要取决于体验过程中最强烈的感受(峰值) 和结束时的感受(终值)。
- 时长忽略:体验的持续时间对整体评价影响甚微。
- 经典实验:被试将手浸入冰水。一组浸入14°C水60秒,另一组先浸14°C水60秒,再浸15°C水30秒。尽管后者痛苦时间更长,但65% 的被试在需要重复体验时选择了更长的后者,因为其结束时痛苦较轻。
- 对“追求快乐”的理性建议:
- 了解局限:个体总体幸福感有约50%受内在的、相对稳定的“快乐设定点” 影响,如同体重有设定点。
- 主动提升:可通过特定练习(如表达感激、改善社会关系)提升快乐“容量”。
- 明智选择:选择内在满足感强且不易适应的体验;避免已知的“损害快乐的因素”。
- 决策动机的多样性:快乐并非唯一驱动力,还包括规则遵循(“好公民应该投票”)、冲动(赶时间而超速)、习惯等非结果导向的动机。
9.2 情绪在评价中的作用
- 定义困难:情绪(emotion)的定义在学界缺乏完全共识。本书中将其定义为包含认知评价、特异性生理反应和可知觉体验三个成分的、由环境变化引发的反应。
- 情绪的适应性功能:现代研究强调情绪具有快速、自动的适应性作用,能辅助甚至优化决策,而非弗洛伊德传统认为的“干扰理性”。
- 例证:恐惧条件反射(Joseph LeDoux等):在动物(大鼠)中,声音与电击匹配后,单独声音即可引发恐惧反应(寒颤、激素释放等)。皮层下通路(如杏仁核)的加工远快于意识层面,形成“快速且不愉快的通路”,使机体能在完全识别威胁前做出反应。
- 快速评价系统:对刺激的好-坏评价发生极快,常在认知识别之前,甚至替代认知识别(Robert Zajonc, 1980)。
- 神经基础:存在独立的神经环路分别处理正性(多巴胺系统)和负性(乙酰胆碱系统)评价;前额叶脑区活动模式与长期情感倾向相关。
- 预期情绪(反事实情绪)的影响:决策时,人们会预期可能出现的后悔(未选选项结果更好)或欣喜(未选选项结果更差)情绪,这些预期会影响决策效用(Mellers等,1999)。
9.3 金钱的价值:从心理物理学到预期理论
价值与效用的测量
- 概念:价值常与货币等价物同义;效用或个人价值则指更广泛意义上的渴望性程度。
- 心理物理学起源:
- 韦伯定律:产生最小可觉差所需的刺激增量与原刺激强度成固定比例(韦伯分数)。
- 费希纳定律:心理感觉强度是物理刺激强度的对数函数(图9.2),解释了边际报酬递减规律。
- 经济学中的应用:丹尼尔·伯努利将边际递减规律应用于金钱的主观价值(效用),认为金钱的效用函数也呈对数形,即收益的边际效用递减。
预期理论的核心观点
预期理论(Kahneman & Tversky, 1979)是一个描述性理论,解释人们在风险决策中如何实际评价结果。
- 两大核心特征:
- 参照依赖:人们根据结果与某个参照点(通常是现状)的差距来评价得失,而非根据最终总财富。
- 损失厌恶:价值函数在损失域比收益域更陡峭,即人们对损失的感受比等量收益更强烈(图9.3)。
- 框架效应与矛盾选择:
- 收益框架:“已得200美元,选确定再得100美元,还是赌50%得200美元或0美元?” → 多数人风险规避,选确定收益。
- 损失框架:“已得400美元,选确定损失100美元,还是赌50%损失200美元或0美元?” → 多数人风险寻求,选赌博。
- 矛盾本质:两个问题的最终结果完全等价(确定300美元 vs. 50%得200/400美元),但因参照点改变(200 vs. 400美元),导致选择相反,违背了经典效用理论(应只关注最终结果)。
- 虚假确定性效应:
- 例:选项a(20%得45美元)与b(25%得30美元)对比;选项a‘(80%得45美元)与b’(确定得30美元)对比。
- 行为:很多人选择a(期望值更高)和b‘(确定性吸引)。当用两阶段形式呈现逻辑等价的选项a’‘与b’‘时,人们因将“进入第二阶段”视为心理现状,而对第二阶段的“收益”表现出风险规避,选择b’‘。
- 本质:因问题表征方式(整体 vs. 分阶段) 不同而导致偏好逆转,是一种框架效应。
- 与Coombs模型的潜在冲突:Coombs的“坏的事物会逐渐升级”暗示负性结果的边际负效用递增,而预期理论的损失域仍是边际递减(只是更陡)。一种解释是,Coombs模型描述体验效用,而预期理论描述决策效用(对未来结果的预测)。
预期理论成功描述了直觉性、自动思维导致的决策模式,而经典效用理论则提供了理性决策的标准化基准。我们应认识前者,并在必要时运用分析性思维遵循后者。
9.4 预测我们重视什么:决策效用的偏差
决策的理性模型要求偏好稳定且能准确预测未来体验(决策效用 ≈ 体验效用)。现实中存在大量预测偏差。
三种评价启发式及其偏差
- 基于记忆的启发式:依赖过去类似经历的体验。
- 偏差:记忆可能不准确或不具代表性。
- 基于模拟的启发式:想象未来情景来预测感受。
- 主要偏差:
- 免疫忽略(Gilbert等,1998):预测时忽略心理适应能力,高估好/坏事件对长期幸福感的极端且持久的影响(如获得/失去终身教职)。
- 热-冷共情差距(Loewenstein,1996):处于“冷”(平静)状态时,无法准确预测自己在“热”(情绪唤起、饥饿、性唤起等)状态下的行为和偏好,导致自我控制失败(如低估诱惑力)。
- 伴随情绪的影响(Lerner等):决策时无关的偶然情绪会系统性扭曲评价。如恐惧使人风险规避,悲伤使人愿花钱改变处境,厌恶促使人贱卖物品,愤怒使人冒险。
- 主要偏差:
- 基于计算的启发式:通过推理预测喜好。
- 典型偏差:多样化偏差(Simonson,1990):当为未来多次消费(如三次会议点心)做一次性选择时,人们会过度追求多样化;而为每次单独选择时,多样性需求降低。人们低估了自己在不同时间点偏好的稳定性。
9.5 价值的建构过程
价值判断常表现出不稳定性和情境依赖性,可用价值抽样模型(Tourangeau, Rips, & Rasinski, 2000)解释(图9.4)。
- 模型的四个阶段:
- 理解问题。
- 从长时记忆中提取相关信息。
- 整合提取出的评价信息。
- 生成反应。
- 核心机制:当被问及对某事物的态度或价值判断时,问题作为“探针”从记忆中抽取相关的评价性信息片段。这些片段受当前情境、心境、问题顺序等影响而波动,导致每次“抽样”结果不同,进而使最终评价不稳定。
- 解释的现象:
- “无态度”现象(Converse):选民态度在调查中看似随机波动,实为记忆抽样波动的结果。
- 情境效应:问题表述或前置问题的改变,会系统性影响信息提取和最终评价。
- 整合过程:类似于锚定-调整,可能是一个加权平均的过程。
结论:尽管基于评价的偏好常表现出不一致和非理性,但人们通常能有效选择行为以满足其当前目标。理解价值建构的过程和偏差,是理解决策行为的关键。
第10章:从偏好到选择——复杂情境下的决策策略与理性边界
我搞不懂艺术,但我知道自己喜欢什么。——佚名
10.1 引言:选择的复杂性
- 核心困境:选项过多可能导致决策瘫痪。
- 经典案例:果酱实验:
- 情境:超市促销24种新奇口味果酱。
- 结果:虽有上百人品尝并拿走折扣券,但仅有3% 的人实际购买。
- 对比情境:当果酱种类减少到6种时,购买率上升到30%。
- 选择困难的原因:
- 选项多维性:备选项通常包含多个需要评价的属性(如公寓的位置、租金、大小等)。
- 属性间的负相关:理想的选项往往不存在,决策者必须进行艰难的权衡(如便宜 vs. 吵闹)。
- 认知资源有限:在大量选项间进行比较会消耗大量认知资源,过程可能令人不快,导致人们放弃选择。
10.2 选择策略:认知工具箱
选择是一系列将局部评价整合为整体评估的策略过程。Payne, Bettman & Johnson (1993) 系统分析了常见的选择策略(图10.1),可从四个维度比较:
- 认知努力程度:策略所需的心智工作量不同,且人们能意识到自己所用的策略(元理性)。在重要决策中,人们倾向于使用更全面、更耗神的策略。
- 补偿性 vs. 非补偿性:
- 补偿性策略:允许不同属性间相互权衡与补偿(如好地段可以抵消高租金)。
- 非补偿性策略:设定刚性标准,任一属性不达标即排除整个选项(如“租金超过700美元就不考虑”)。这类策略节省认知资源但可能错失均衡的优质选项。
- 信息搜索方式:
- 基于备选项:逐个评估每个选项的所有属性,形成整体印象后再评估下一个。
- 基于属性:选定一个属性,横向比较所有选项在该属性上的优劣,再切换至下一个属性。此法通常更省认知资源。
- 信息需求量:
- 穷尽型策略:需要考察所有相关信息。
- 节省型策略:仅利用部分信息即可做出选择。非补偿性和基于属性的策略通常更“节省”。
典型策略举例
- 多属性效用理论 (MAUT):最全面、系统的补偿性策略。本质是线性加权求和,为每个属性赋予权重并评分,选择总分最高者。
-
“通过这种方式,各种支持或反对的理由同时呈现在思考范围内,接着我就开始尝试估计它们各自的权重……我了解到了全貌,因而我认为自己能够做出较好的判断……”——本杰明·富兰克林致约瑟夫·普利斯特列的信(1772),阐述其“德智代数法”。
-
- 满意决策 (Simon, 1956):设定一个可接受的标准,搜寻并选择第一个达到此标准的选项,而非寻找最优选项。
- 排除法 (Tversky, 1972):选定一个重要属性,排除所有不达标者,再换一个属性继续排除,直至剩一个或少数几个选项。
- 选最好的 (Gigerenzer et al., 1999):从最重要属性出发,直接选择在该属性上明显占优的选项。
在信息有限、时间紧迫或有认知干扰的现实条件下,“快速而节省”的启发式策略常能达到接近最优策略的效果,展现出适应性。
10.3 有限理性:选项排序的影响
- 选项的顺序会系统性影响选择结果,这违背了理性原则(选择应基于选项本身,而非呈现顺序)。
- 右位效应 (Nisbett & Wilson, 1977):
- 实验:将商品(连衣裙、长袜)排成一行呈现,被试总是倾向于选择最右边的商品。
- 可能解释:人们从左向右浏览;每个新商品都有新特征吸引注意,而最右边的商品没有“后续竞争者”来削弱其吸引力。
- 本质:这是一种无意识的顺序效应,人们会否认其影响。
满意决策与有限理性
- 有限理性 (Simon, 1956):决策者在认知能力、信息、时间有限的约束下,追求“满意”而非“最优”的理性。
- 关键问题:在满意决策中,搜索顺序至关重要,且常由与决策无关的因素决定,使选择可能被操纵。
- 有限理性策略的实用性案例:招聘秘书:
- 情境:100人申请一个职位。
- 策略1(深入评估前20人):若随机排序,前5名优秀者中有1人出现在前20名的概率为0.68。此策略节省大量时间。
- 策略2(最优停止规则):先随机评估前37%的申请者(约37人),了解整体水平,之后选择第一个比这37人都优秀的申请者。此策略下选到最优候选者的概率最高(约37%),平均需评估约29人。
- 结论:在现实约束下,采用事先设定的、有规则的有限理性搜索策略,通常优于试图评估所有选项的“完全理性”但不可行的做法。
10.4 背景效应:选项如何被分组与对比
- 理性原则:无关备选项独立性——在A和B之间偏好A,那么加入一个不会被选的C,不应改变A和B之间的偏好顺序。
- 现实违背:背景(即其他选项的存在)会改变选项间的吸引力对比。
- 诱饵效应 (Huber & Puto, 1983):
- 例:在电池A(22小时,2.10)间,多数人偏好A。
- 加入劣质诱饵C(14小时,$1.50)后,A显得比C好很多,偏好A的比例上升至60%以上。
- 加入优质诱饵D(32小时,$2.70)后,B显得比D性价比高,偏好B的比例上升至约60%。
- 权衡对比效应 (Tversky & Simonson, 1992):
- 例:一款429面包机后,原先$275的型号销量翻了一倍多。昂贵选项使便宜选项显得更超值。
- 诱饵效应 (Huber & Puto, 1983):
10.5 无意识选择的争论:直觉 vs. 分析
所有决策都包含意识与无意识成分。争论焦点在于:在某些条件下,快速的、直觉的(无意识)选择是否优于深思熟虑的(有意识)分析?
-
支持直觉选择的研究:
- Wilson等人(1991,1993):选择果酱、海报、课程时,仅做选择的被试比需要陈述理由的被试,在后续(如三个月后)表现出更高的满意度。解释:陈述理由会干扰基于未来实际消费体验的、更自动的评价过程。
- Dijksterhuis等人(2006):在复杂的多属性选择任务(如选车,有12个属性)中,完成分心任务后(无意识思考) 再做选择的被试,选择最优选项的比例(59%) 显著高于被要求思考4分钟(有意识思考)的被试(22%)。提出“无意识思考理论”,认为无意识系统计算能力更强。
-
对“无意识思考优势”的质疑与评论:
- 任务特殊性:Dijksterhuis的实验条件(快速呈现大量属性、强制思考4分钟)可能人为压制了有意识策略的正常发挥。
- 策略差异:本书推荐深思熟虑的策略(如富兰克林的方法)与实验中简单的“思考4分钟”完全不同。
- 后续研究:其他研究者在更自然的“自由思考”条件下,未发现无意识思考的优势。
- 结论:无意识思考的优势可能仅限于特定、非典型的选择条件。对于复杂、重要的决策,我们仍然推荐慎重的、受控的分析性策略。
10.6 如何做出好的选择:分析与建议
- 核心方法:分解与线性整合。
- 识别相关属性:根据当前决策目标,列出所有心理上独立且重要的评价维度。属性是否客观相关不重要,重要的是对你是否独立重要。
- 评估与赋权:为每个选项在各属性上评分,并根据重要性赋予权重。
- 计算与比较:通过加权求和(线性模型)计算每个选项的总分,选择最高分者。
- 方法论价值:
- 富兰克林的“德智代数法” 和达尔文在婚姻决策中使用的列表法都是此方法的典范。
- 研究表明,即使权重和评分不完美,线性模型的预测力也常优于整体的直觉判断。
- 关键在于分解,它迫使决策者独立审视每个价值维度,减少自动、整体性直觉可能带来的偏差。
- 确定真实价值的挑战:
- 匹配法的偏差 (Tversky, Sattath, & Slovic, 1988):当通过匹配任务(如“击球率0.310相当于多少本垒打?”)来隐性地确定属性权重时,人们会系统性低估在实际选择中该属性的重要性。
- 根本难题:“真实价值”是什么?本书无法解决,但主张通过内部审视和比较来确定权重的分解过程,优于跨越多个变量的全局直觉判断。
第11章:理性决策理论——期望效用及其公理体系
没有什么比接受忠告更让人受益,即便最终事与愿违,(听取忠告)这一选择仍然是正确的。——希罗多德(公元前484~公元前425年)
11.1 理性与期望效用理论
- 理性的定义:理性行为是指使决策结果取得最大价值的行为。理性与选择过程有关,而非结果。
- 期望效用理论 (Von Neumann & Morgenstern, 1947):
- 目标:将理性选择的原则公理化,从而从个体偏好中推导出效用的数值度量。
- 核心逻辑:如果决策者的选择遵循一系列理性公理,那么就可以为每个结果赋予一个效用值(实数)。选项的期望效用是其所有可能结果的效用按其发生概率的加权和。决策者偏好期望效用更高的选项。
- 两种解读视角:
- 综合视角:先有效用和概率判断,再据此做出选择(符合直觉)。
- 分析视角:从观察到的选择行为中,反向推断出隐含的偏好和效用(经济学常用)。
- “效用” vs “个人价值”:公理化理论中的“效用”是一个由公理衍生的数学概念,与直觉或语言表达的“个人价值”内涵不同,但二者存在关联。
- 价值观的特点:
- 价值观可用语言表达,不一定完全通过行为推断(否则无“伪善”概念)。
- 价值观具有情境独立性,是对偏好、行为、信念的整体概括。
- 罗基奇价值观量表等工具通过测量对抽象价值条目的排序来预测行为,其预测力可能源于信念抽样模型(见第9章)。
11.2 公理法:从实数性质到理性公理
- 公理法的价值:将理论的核心假设以精确的符号体系表述,便于检验、应用和修正。
- 类比:质量的度量 (Holder, 1901):
- 通过定义物体重量之间的 “重于或等于”关系(R) 和 串联操作(O,将物体放于天平同一端),并设定8条公理(如可比性、传递性、加法封闭性等),可以推导出用实数(质量)来度量物体的可能性。
- 启示:如果一个系统(如选择行为)满足特定公理,就能为其元素(如选项)建立数值量表。
- 为期望效用理论铺垫:期望效用理论采用了类似的公理化思路,用偏好关系和概率混合操作来构建效用量表。
11.3 期望效用理论的公理体系
理论的基本元素是选项(或赌博),即由不同概率的结果组成。基本关系是偏好,操作为概率混合(ApB:以概率p得到A,以概率1-p得到B)。
七大公理及其理性内涵
- 可比性:对于任何两个选项A和B,决策者总能比较其偏好,即要么A≿B,要么B≿A,或两者同时成立(无差异)。
- 争议点:现实中是否存在真正的“无法选择”?“显示性偏好”理论认为选择本身即定义了偏好,但选择可能受认知困难或情绪影响,未必反映真实偏好。
- 传递性:如果A≿B且B≿C,那么A≿C。
- 理性捍卫:违背传递性可能导致**“钱泵”** ——他人可利用其偏好循环无限榨取钱财。从康德哲学看,具有传递性的选择类似于为所有人制定永久性政策,更具宏观合理性。
- 闭合性:如果A和B是选项,那么它们的任何概率混合ApB也是一个选项。
- 这是构建理论的基础,要求决策者能将概率混合本身视为一个可评估的选项。
- 概率的分布 (可化简性):[(ApB)qB] ~ (ApqB)。
- 要求决策者遵循概率论,将多阶段赌博简化为等价的一阶段赌博(见图11.2, 11.3)。
- 行为违背:虚假确定性效应(见第9、10章)中,人们对逻辑等价的单阶段与两阶段赌博表现出不同偏好,违背此公理。
- 独立性:如果A≿B,那么对于任何选项C和概率p>0,都有 (ApC) ≿ (BpC)。
- 核心公理,争议最大。意为在两个选项中加入相同的“概率彩票”不应改变原有的偏好顺序。
- 行为违背:虚假确定性效应也违背此公理(见图11.5)。此外,人们对结果分布的偏态(见图11.6)有偏好(如喜欢正偏态的彩票),这也与独立性公理隐含的“只关心期望值”相冲突。
- 一致性:对于任何结果A和B,如果A≿B,那么A ≿ (ApB) ≿ B。
- 理性上无可辩驳:如果偏好A甚于B,那么一个以一定概率得到A、否则得到B的赌博,其吸引力应介于A和B之间。
- 可分解性 (阿基米德性质):对于任何结果A≻B≻C,存在一个概率p,使得B ~ (ApC)。
- 意味着不存在“无限好”或“无限坏”的结果,总能用概率混合在好坏结果之间找到一个无差异点。
- 关键作用:此公理为测量效用值提供了方法(见下文)。
效用测量与应用
- 测量方法:利用公理7,可以给最好和最坏的结果任意赋值(如100和0),然后通过调整概率p,找到使决策者对确定的中等结果B与赌博(ApC)无差异的p值,从而计算出B的效用值(例如,若p=0.8时无差异,则B的效用值为80)。
- 效用函数的形状:
- 凹函数(边际效用递减)常对应风险规避。
- 凸函数(边际效用递增)常对应风险寻求。
- 效用函数的测量可用于解释和预测个体在风险决策中的行为。
11.4 对公理的传统反驳:两大悖论
Allais悖论
- 情境:
- 选择1:A. 确定得到100万美元;B. 10%得250万,89%得100万,1%得0。
- 大多数人选A。
- 选择2:A′. 11%得100万,89%得0;B′. 10%得250万,90%得0。
- 大多数人选B′。
- 选择1:A. 确定得到100万美元;B. 10%得250万,89%得100万,1%得0。
- 矛盾:根据期望效用理论,在第一组中选择A意味着U(100万) > 0.10U(250万) + 0.89U(100万) + 0.01U(0)。若设U(250万)=1, U(0)=0,则可推出 0.11U(100万) > 0.10。在第二组中,A′的期望效用为0.11U(100万),B′为0.10。因此,偏好A应导致偏好A′,但实际人们偏好B′。
- Savage的分析 (见图11.9):通过将结果按筹码颜色重新表述,显示出两组选择中“红色筹码”的奖励相同,选择应只取决于对“蓝色”和“黑色”筹码奖励的偏好,因此偏好不应反转。这凸显了对独立性公理的违背。
Ellsberg悖论
- 情境:桶中有90个球,30红,60个不知比例的黑和黄。
- 选择1:Ⅰ. 红球赢100;Ⅱ. 黑球赢100。多数人选Ⅰ(规避模糊)。
- 选择2:Ⅲ. 红球或黄球赢100;Ⅳ. 黑球或黄球赢100。多数人选Ⅳ(仍规避模糊)。
- 矛盾 (见图11.10):根据独立性,黄球结果相同的部分应不影响选择。偏好Ⅰ胜于Ⅱ意味着主观认为红球多于黑球;但偏好Ⅳ胜于Ⅲ意味着主观认为黑球或黄球多于红球或黄球,这又意味着黑球多于红球。两者矛盾,表明人们无法为模糊事件赋予一致的主观概率,违背了期望效用理论对概率评估的要求。
11.5 理论的适用条件:决策分析的应用
期望效用理论不仅是描述性理论,更是规范性理论(指导应如何决策)。决策分析领域运用其框架帮助人们优化复杂决策。
应用实例
- 夫妻乘飞机问题:
- 情境:一对夫妻带孩子旅行,考虑是否分开乘坐不同航班以降低全家同时遇难的风险。
- 分析:设两人同时遇难效用=-1,都安全=0,一人遇难效用=x。计算分开飞与一起飞的期望效用。结果发现,只有当 x > -0.5(即一人遇难的痛苦小于两人同时遇难痛苦的一半)时,分开飞才是更优选择。这促使决策者反思自己对风险的真实价值判断。
- 医疗检查顺序问题 (Fryback & Thornbury, 1976):
- 情境:肾脏病变需做两项检查(抽吸法和动脉造影术),后者痛苦和风险是前者的10倍。医生通常在判断肿瘤概率>1/2时先做动脉造影。
- 期望效用分析:计算表明,只有当肿瘤概率 > 10/11时,先做动脉造影才是最优。这远高于医生实际采用的阈值。分析促使医生调整决策,更常优先选择创伤小的检查。
- 工厂自动化决策:
- 情境:工厂主在引进自动化设备(提高利润但减少就业)上犹豫。
- 决策分析:通过澄清其核心价值(提供就业、社区声望而非仅利润),分析显示自动化不符合其根本目标,从而解释了其不安并避免了错误决策。
决策分析的价值
- 帮助决策者澄清和量化内在价值与目标。
- 促使行为与价值观保持一致,避免因沉没成本等非理性因素干扰。
- 并非强加价值观,而是提供工具使隐含的价值观显性化,从而做出更理性的选择。
11.6 回应关于决策分析的不合理质疑
- 质疑:决策分析(依赖数字和计算)是否缺乏人性、令人困扰、过于机械化?
- 回应:
- 并非磨灭人性:效用理论恰恰是为了凸显和尊重个人价值,帮助人们发现什么最重要。
- 并非必然导致犹豫:理论本身鼓励符合价值观的果断行动。例如,Von Neumann和Morgenstern对扑克完美策略的分析表明,最优策略是快速全押或弃牌,而非犹豫不决。
- 数字是工具而非目的:数字用于明晰化思考,而非替代人性判断。目标是 “发现我们珍视的事物” (James March, 1978),并据此行动。
第12章:描述性决策理论——预期理论及其应用
在理论框架中,理论和实践没有差别,回到实际生活中,理论和实践确实有差别。——简·L.A.·范德施耐肖特(1953~1994)
12.1 引言:为什么需要描述性理论?
- 理性理论的局限:主观期望效用理论在描述人类实际行为方面并非完全有效(如Allais悖论、Ellsberg悖论所示)。
- 非期望效用理论:保留了期望效用框架的基本形式,但通过调整以更准确地描述行为。其中最成功和最具影响力的是Kahneman和Tversky的预期理论。
- 预期理论的地位:
- 它抓住了理性的本质,并指出行为可向其调整。
- 它是对风险决策最好的综合性描述理论,为理解大量非理性“反常”行为提供了统一视角。
12.2 预期理论的核心内容
预期理论将决策过程分为两个阶段:编辑和评价。选项的总价值 V 由以下公式表示: V = Σ (Πᵢ vᵢ) 其中,vᵢ 是结果的价值,Πᵢ 是与客观概率相关的决策权重。
编辑阶段:构架决策问题
编辑阶段为决策构建认知表征,涉及以下关键操作:
- 设定参照点:
- 通常将现状设定为参照点(价值为0),用以区分获益与损失。
- 参照点也可以是抱负水平(期望目标)、安全水平(可承受的最大损失)等。这些点影响信息搜索和满意度。
- 案例:赛马赌博:一天快结束时,赌徒更倾向于押注赔率高(胜率低)的马,以期赢回损失,将“收支平衡点”作为参照点。
- 商业决策:管理者常关注下跌风险(可承受的最大损失)、盈亏平衡点和生存点。
- 整合与分离结果:
- 人们倾向于分离获益(如,两个100美元的礼物比一个200美元的礼物更让人开心)和整合损失(如,一笔200美元的罚款比两笔100美元的罚款感觉更好)。
- 这源于价值函数在参照点附近最为敏感的特性。Richard Thaler据此提出了心理账户概念。
评价阶段:计算选项价值
评价阶段包含估价和决策加权两个核心计算过程。
-
估价:价值函数 (见图12.1) 价值函数 v(x) 具有三个核心特征:
- 参照点依赖性:价值基于与参照点的偏离(获益或损失)而定。
- 敏感性递减:获益和损失的边际价值都递减。函数形式为:
v(x) = x^α (若x≥0); v(x) = -λ(-x)^β (若x<0)。其中α和β通常小于1(约0.88)。 - 损失规避:损失带来的痛苦感大于等量获益带来的快乐感。系数λ(损失规避系数)通常约为2.25。
-
决策加权:决策权重函数 (见图12.2) 决策权重函数 π(p) 将客观概率 p 转化为决策权重,呈反S型曲线,特征如下:
- 对极低概率过度反应(曲线在0点附近陡峭):解释了购买彩票或为消除极小风险支付过高费用的行为。
“消除‘最后10%的风险’是毫无必要并且没有收益的尝试。”——美国最高法院法官Stephen Breyer (1993),以新汉普希尔有毒废料清理诉讼为例,说明为消除极低风险花费930万美元是不合理的。
- 对中等概率不敏感(曲线中部平坦):人们对中等概率的变化反应不足。
- 对高概率反应不足,但对确定性极为看重(曲线在1附近再次陡峭):确定性效应解释了Allais悖论中的选择模式。
- 函数形式为:
π(p) = p^γ / (p^γ + (1-p)^γ)^(1/γ),其中γ约为0.65。
- 对极低概率过度反应(曲线在0点附近陡峭):解释了购买彩票或为消除极小风险支付过高费用的行为。
- 决策流程图:图12.3总结了预期理论的决策过程。
12.3 获益-损失框架效应
框架效应:对逻辑上等价的选项进行不同的表述(构架),会导致人们做出不同的、甚至矛盾的选择,这违背了理性决策的不变性原则。
经典案例
- 亚洲疾病问题 (Tversky & Kahneman, 1981):
- 生存框架:“如果采用A方案,200人将生还(72%选择);如果采用B方案,有1/3机会600人生还,2/3机会无人生还(28%选择)。”
- 死亡框架:“如果采用C方案,400人将死去(22%选择);如果采用D方案,有1/3机会无人死去,2/3机会600人死去(78%选择)。”
- 矛盾:A与C、B与D结果等价,但多数人在获益框架(生存)下风险规避,在损失框架(死亡)下风险寻求。
- 医疗决策框架 (McNeil等, 1982):
- 向患者描述手术效果时,使用生存率框架只有18%的人选择放射治疗,而使用死亡率框架则有44%的人选择放射治疗。框架效应在医生、患者中均存在。
- 现实问题:医生常避免与晚期患者坦率讨论预后。如何中立呈现信息成为挑战(建议同时呈现两种框架或使用视觉图表)。
- 金钱选择问题:
- 框架1(收益):刚得到1000美元,选“确定再得500美元”还是“抛硬币赌1000美元或0美元”?多数人选确定选项。
- 框架2(损失):刚得到2000美元,选“必须返还500美元”还是“抛硬币赌返还0美元或1000美元”?多数人选赌博选项。
- 两对选项实质等价,但偏好发生反转。
框架效应的性质与影响
- 并非言语花招:有深刻的心理学原理支持,且效应持久。即使向被试指出其选择矛盾,他们仍可能坚持原选择或仅部分更改 (Lewis; Hawkins, Dawes, & Johnson, 1987)。
- 应用与解释:
- 保险与彩票:购买保险可被构架为用小额确定损失规避大额可能损失;购买彩票可被构架为用极小成本博取巨大收益(尽管期望值为负)。
- 安全带使用:人们将不系安全带视为小的舒适感收益,而低估事故带来的巨大损失。若将系安全带构架为保持现有幸福状态的保险,可能更有效。
- 法律策略:原告律师用损失框架(要求赔偿伤害),被告律师用收益框架(讨论支付金额)。
12.4 损失规避及其表现
损失规避指等量损失带来的痛苦大于等量获益带来的快乐(λ>1)。其最有力的证据之一是禀赋效应。
禀赋效应
- 定义:一旦拥有某物,个体对其的评价(卖价)会显著高于未拥有时的评价(买价)。
- 经典实验 (Kahneman, Knetsch, & Thaler, 1991):给一半学生咖啡马克杯,拥有者的卖价中位数约为2.25-$2.75。这种差异在多种物品和实验设计中均稳定存在。
- 机制解释:
- 质询理论 (Johnson, Haubl, & Keinan, 2007):卖者关注物品的用处,买者关注金钱的其他用途,不同的关注点导致价值评估差异。
- 情绪影响 (Lerner等, 2004):悲伤情绪增加买价(“悲伤不吝啬效应”),厌恶情绪降低卖价。这可以用情绪评价理论解释:悲伤引发改变处境的动机,厌恶引发“驱逐”物体的动机。
- 市场含义:禀赋效应导致买卖双方心理价值存在差异,是市场交易效率低下(“棘手问题”)的部分原因。
其他表现与应用
- 风险不对称估价 (Thaler):让人们暴露在0.001患病风险下,他们要求10000美元补偿;但让已携带病毒者为将风险从0.001降至0的疫苗付费,他们只愿出200美元。
- 短视性损失规避 (Thaler):解释为何人们不愿投资股票。
- 现象:投资者过度偏好稳定债券而非长期收益更高的股票。
- 解释:股票价格频繁波动带来痛苦(损失规避)。若频繁查看投资回报(如年度报表),人们更规避风险;若查看周期长(如30年总结),则更愿投资股票。
- 含义:投资报告的频率影响风险偏好。
12.5 未来展望与局限
- 预期理论的成就:总结了大量研究成果,将反常行为与基本心理过程(参照点、损失规避、概率加权)相联系。
- 理论的局限:仍有一些现象无法完美解释,例如第4章提到的偏好反转(在单独估价和配对选择时偏好顺序相反)。
- 决策的不可预测性:框架效应和其他情境因素表明,选择常受与结果无关的偶然因素影响,这使得个人和社会层面的决策历史带有一定“主观任意性”。
第13章:判断与决策研究的新方向
我们很难做出预测,尤其是对于未来。——尤吉·贝拉(Yogi Berra,1925~),美国著名的棒球运动员、总教练
行为决策科学的未来将聚焦于三个相互关联的新兴方向:决策的神经科学、决策中的情绪作用,以及动态决策过程。这些方向旨在将行为层面的研究还原到更基础的神经生物学层面,并更真实地模拟现实世界的决策。
13.1 决策的神经科学(神经经济学)
- 目标与价值:将决策行为与神经基础结合,实现不同分析层面的 “融通” (consilience)。这有助于解决单一行为层面上的棘手问题,并产生突破性发现。
- 研究技术与方法:
- 功能性磁共振成像(fMRI):测量血氧水平(BOLD),空间分辨率高(~3mm³),时间分辨率约2秒。
- 脑电图(EEG):测量头皮脑电,时间分辨率高,空间分辨率低。
- 动物单细胞记录:通过植入微电极,提供精确的时空定位。
- 关键脑区及其功能定位 (见图13.1):
- 背外侧前额叶:与工作记忆和审慎思考相关。
- 边缘系统(纹状体/伏隔核、杏仁核、脑岛):与奖赏评估、动机和情绪反应相关。
- 眶额叶皮层:作为“交换机”,整合认知情境信息与情绪评价。
- 关键研究案例:
- Newsome的猴子实验:训练猴子判断运动方向以获取果汁奖励。在决策前,猴子侧顶内沟和上丘的神经元放电频率增强,起到了“概率计”的作用。电刺激这些区域会改变猴子的决策,证实了其因果作用。
- 奖赏价值编码:中脑多巴胺神经元的活动与奖赏概率和数量呈线性关系,如同“价值计”(见图13.2)。
- Camerer的模糊 vs. 风险研究:使用fMRI考察大脑对风险(明确概率)和模糊(概率未知)的反应差异。
- 实验设计:比较三种模糊 vs. 风险情境:1) 明确牌组 vs. 成分未知牌组;2) 纽约气温 vs. 杜尚别气温;3) 与信息对等对手 vs. 与信息优势对手游戏。
- 研究发现:
- 脑区激活差异:考虑模糊选项时,杏仁核(与恐惧情绪相关)和眶额叶皮层(整合认知与情绪)激活更强;考虑风险选项时,纹状体(与奖赏预期相关)激活更强。
- 与行为相关:这些脑区的激活强度分别与被试行为上的模糊规避和风险规避程度相关。
- 脑损伤病人证据:眶额叶损伤病人对风险与模糊无偏好差异,支持该脑区在区分两者中的因果作用。
13.2 决策中的情绪
情绪在决策中的作用从被视为干扰因素转向被视为快速、适应性反应的核心。
- 历史视角:双重系统理论:
- 源自柏拉图(理性御者控制野马)、弗洛伊德(骑手控制烈马)等比喻,描述了理性/认知系统与情绪/本能系统的竞争。
- 神经证据 (McClure等,2005):在即时奖赏 vs. 延迟奖赏选择中,与情绪相关的边缘系统和眶额叶区域激活;而在比较两个延迟选项时,与思考推理相关的额叶和顶叶区域激活。
- 情绪作为适应性快速反应:
- Zajonc的单纯暴露效应:对刺激的偏好会随着其重复出现而增加,甚至发生在无意识识别或遗忘之后。这表明偏好形成可以独立于认知分析(“偏好无需推断”)。
- Slovic的风险感知与情绪启发式:人们对风险的判断和应对努力,不仅基于客观风险,更基于风险的 “个性” ——即其唤起的情绪(如恐惧感、熟悉度)(见图13.3)。情绪启发式指用整体的情绪感受(好/坏)替代复杂的概率、成本效益分析。
- “风险即情绪”框架 (Loewenstein等):强调对威胁的即时情绪反应(如恐惧)可能取代分析性的决策过程。
- 案例 (Rottenstreich & Hsee, 2001):当结果涉及高情绪唤醒(如明星的香吻、电击)时,人们对概率变化不敏感(决策权重函数更平坦);而对金钱结果则对概率敏感。这表明情绪会扭曲概率加权。
- 特定情绪效应:
- 不同的消极情绪(如恐惧、愤怒、厌恶)会引发不同的行为倾向,从而对决策产生特异性影响 (Lerner & Keltner, 2000)。
- 根本问题:情绪与认知的界限,以及情绪的神经标记仍不明确。
13.3 动态决策实验研究方法的兴起
传统研究多关注单次、定义明确的决策。新方向关注连续的、从经验中学习的、多成分的动态决策任务。
- 里程碑:爱荷华赌博任务 (Bechara, Damasio等,1997):
- 任务设计:被试从四副牌(A、B、C、D)中反复抽牌以赢钱(见图13.4)。A、B副单次收益高(50),伴有小额损失,长期期望值为正。
- 关键发现:
- 正常被试:初期被高收益吸引,但很快(经20-40次试错)转向选择有利牌(C、D)。在意识到哪副牌不利之前,他们的皮肤电反应(情绪唤醒)已显示出对不利牌的预期焦虑。
- 眶额叶损伤病人:持续选择不利牌,且不产生预期的皮肤电反应。
- 理论:躯体标记假设 (Damasio):在复杂决策中,由情绪引发的躯体标记(如 gut feeling)能快速筛选选项,排除极差选择,从而辅助认知系统进行精细推理。眶额叶损伤者缺乏此功能,导致在无关紧要的选择上犹豫不决。
案例:菲尼亚斯·盖吉:1848年事故中铁棍穿透前额叶。伤后智力完好,但性格剧变,变得“反复无常、优柔寡断”、“做决策从不考虑自己的最佳利益”。成为研究情绪与决策关系的经典案例。
- 其他新兴动态任务:
- 气球模拟风险任务:给气球充气赚钱,充爆则失去所有。
- 累计赌博任务:打开盒子找奖赏,打开错误盒子会损失所有。
- 钓鱼风险任务:模拟钓鱼,在风险与模糊选项间选择。
- 行为投资分配策略任务:模拟股票市场投资。
- 动态研究的意义:
- 关注从经验中提取概率的过程,这可能不同于直接给出数字概率。
- 催生新的理论模型,将决策描述为包含信息搜集、停止规则和行动选择的多阶段动态过程。
- 为连接行为数据与神经科学数据提供了更自然的框架。
13.4 总结与展望
神经科学、情绪和动态决策这三个方向紧密联系、互相促进:
- 神经科学有助于阐明情绪的机制。
- 情绪体验很大程度上反映大脑的活动。
- 动态任务能更真实地模拟引发神经和情绪反应的决策环境。
这些进展将深化我们对理性行为本质的理解,并很可能改变描述性决策理论的形态。
第14章:赞美不确定性
教导人们在不确定情境下的生存之道,使人们不至于因犹豫不决而不知所措。——伯特兰·罗素(1872-1970),20世纪英国著名的哲学家、数学家、逻辑学家
14.1 不确定性的负面影响
人类普遍厌恶不确定性,常试图通过忽视、发明解释系统或高估个人控制力来应对它。
对不确定性的普遍厌恶与应对
- 社会投入:社会花费巨大以消除不确定性,即使为消除最后10%的不确定性也可能付出不成比例的代价。
- “未知的未知” (拉姆斯菲尔德):指我们毫无概念、无法系统分析的事物(如恐怖袭击),比“已知的未知”(如普通飞机失事)更令人恐惧。
- 构建解释系统:人们常发明“更高水平的基本原理”(如宗教道德叙事、占星学、塔罗牌)来解释随机事件,赋予其表面上的确定性,以缓解对不确定性的恐惧。
- 案例:即使实验未发现任何超感官知觉证据,但对超感官知觉的信仰在学生中普遍存在 (Ayeroff & Abelson, 1976)。
高估技能与低估随机性
- 即使在充满随机性的领域(如体育、投资),人们也倾向于高估技能成分,低估随机性(运气) 的作用。
- 案例:Abelson的棒球研究 (1985):专业球迷估计棒球击球手的击球表现差异中,技能贡献约为25%。实际通过统计分析,技能的可解释变异比例仅为约0.5%。球迷高估了技能作用约50倍。
“棒球迷倾向于将命中率为0.330的击球员视为英雄…而命中率为0.260的击球员是关键时刻的出局者。”——Abelson
- 启示:在许多重复情境中(职业评价、手术、判决),即使微小的判断偏差也会被数百次决策放大,产生巨大累积影响。
迷信行为与概率匹配
- 迷信的产生:当结果混合了技能与机遇时,人们容易产生迷信,混淆因果。
- “赢——保持,输——转换”策略:一种强化迷信的学习模式,使个体无法区分适应性行为与纯粹巧合。
- 概率匹配实验 (Tversky & Edwards, 1966):在70%概率出现蓝牌的随机序列中,理性策略是每次都猜蓝牌(成功率70%)。但被试倾向于按概率匹配,即70%猜蓝,30%猜红,导致成功率降至58%。
- 核心发现:即使经过1000次反馈,并告知顺序随机,被试仍无法接受任务的内在不确定性,坚持寻找模式。
- Suppes的虚假反馈实验:被试收到与反应无关的、虚假的(10%、50%或90%)正确率反馈。
- 虚假高成功率(90%)组:提出简单规则。
- 虚假中等成功率(50%)组:提出复杂规则,并设想如何改进。
- 虚假低成功率(10%)组:变成“方法论者”,思考如何找到规则。
- 极少有人能正确认识到任务是不可能的把戏。
- 理论解释 (Einhorn, 1986):直觉方法倾向于将概率事件视为决定性事件,从而忽略了基础概率的考量。这解释了为何统计(机械)预测方法常优于临床(直觉)判断。
14.2 确定性所带来的快乐错觉
我们对未来幸福的预测存在系统性偏差,常高估结果对长期幸福感的影响。
享乐预测的偏差
- 预测准确性有限:我们只能中等程度地准确预测自己对未来结果的评价和情绪反应。
- 结果的复杂性:结果本身比我们预期的更难预测和更复杂。
- 过度估计影响:我们高估了特定结果对长期幸福的总体验影响。
- 原因一:对回归均值趋势不敏感,导致对好坏结果的预期都过于极端。
- 原因二:免疫性忽视 (Gilbert, 2007):我们低估了自己的心理免疫系统,即从伤害中复原和适应好事的能力。
享乐设定点理论
- 当前最佳幸福理论认为,大多数人有一个享乐设定点——快乐或抑郁的背景水平,由基因或早期经验决定,在个体间差异很大 (Diener & Biswas-Diener, 2008)。
- 重大生活事件(离婚、失业、中奖)会引起强烈的情绪波动,但通常在3到6个月后,个体的幸福感会回归到其设定点附近。
- 对决策的意义:我们花费过多认知资源预测未来的“快乐”,而更有效的策略可能是关注结果的其他实质性属性(如健康、安全、效率、经历),而非概括性的“快乐”预测。
14.3 拒绝不确定性的代价
病态地拒绝不确定性,或坚信一个“公正世界”,可能导致严重的个人和社会后果。
病态解释:从不确定性到妄想
- 案例:病人哈罗德:在经历失业、丧子等一系列打击后,哈罗德将所有事件解释为一个“帮助他的秘密组织”的策划,产生了精神病式的洞察力 (Arieti, 1974)。
- 社会层面的病态解释:将瘟疫归咎于“犹太人投毒”、将经济萧条归咎于特定群体等,都是试图用简单因果叙事消除复杂不确定性的病态努力。
归因偏差与“公正世界”信念
- 健康人群的归因模式:倾向于将成功归因于自身,将失败归因于外部(如运气)。
- 抑郁症患者的归因模式:常表现为相反模式(将失败归因于自身)。
- “公正世界”信念 (Lerner, 1980):认为世界本质是公正的,人们会得到他们应得的。这导致:
- 对受害者的责备:认为贫穷、患病或遭遇不幸的人“罪有应得”,从而减少帮助意愿。
- 受害者的自我谴责:在** hindsight bias **(后见之明偏见)作用下,受害者自己也倾向于寻找自己的“过错”。
后见之明与多原因解释的陷阱
- 案例:埃克森·瓦尔迪兹号油轮泄漏事故:事故发生后,人们很容易构建一个连贯的因果故事(船长酗酒、人员不足、副手失误等)。然而,这些因素单独出现时大多并未导致事故。
- 核心问题:在低基础概率事件和多原因多后果的情境中,追溯性解释通常是不可靠的。前瞻性概率分析远比后见之明的叙事更有价值 (Dawes, 1993)。
虚幻控制信念的危害
- 适度的控制感有助于激励行为(如员工绩效)。
- 过度的、虚幻的控制信念则是有害的:
- 导致傲慢(将成功全归功于己)或抑郁(将失败全归咎于己)。
- 案例:Taylor的乳腺癌患者:一位患者相信通过控制饮食(如吃芦荟)可以防止癌症复发。复发后,她才转而去做自己真正想做的事(写小说)。对虚幻控制的执着可能浪费了宝贵的时间和精力。
- 理性观点:我们只需要基于现实的控制能力。像成人一样生活,意味着接受我们对结果的控制是有限的、依赖于具体情境的,而非泛化的。
14.4 致不确定性的两声喝彩
不确定性并非全然消极,它是希望、自由和道德选择的基础。完全的确定性可能是可怕且乏味的。
不确定性的积极价值
- 希望之源:未来的不确定性孕育了希望。如果一切(如职业成功、疾病结局)都提前确定,生活将失去挑战和意义。
- 自由与道德的前提:只有当我们不知道确切结果时,才拥有真正的选择自由,并面临道德困境。
对确定性信息的矛盾态度:以基因为例
- 人们对于获知可能导致严重负面结果的确定性基因信息(如阿兹海默症、亨廷顿舞蹈症基因)态度矛盾。
- 亨廷顿舞蹈症检测研究 (Sieff, Dawes, & Loewenstein, 1999):
- 主要发现:最令人失望的结果是无结论性的检测。携带致病基因者适应了坏消息(未普遍自杀或放弃生育),而未携带者也未过度狂喜。
- 结论:人们会适应,但低估了自己的适应力。
- 艾滋病检测研究:类似地,人们高估了阳性或阴性结果对自己五周后情绪的影响,实际情绪比预测的更中性。
- 核心悖论:追求知识(减少不确定性)是人的天性,但终极的确定性可能并不令人愉悦。
14.5 与不确定性共存
接受不确定性是智慧和勇气的体现,也是运用决策心理学知识改善生活的起点。
- 智慧:在于识别哪些是不确定的,理解自身知识的局限,接受世界的随机性。
- 勇气:在于在认识到危险后仍能前行,而不是依赖“世界是公正的”、“我不会受伤害”等错误的安全感。
- 本书的启示:
- 认识自身局限:了解决策与判断中的偏见和弱点。
- 运用工具:尽可能使用统计分析和概率思维,构建问题的外在表征(如图表)。
- 系统化思考:花时间获取正确的认知工具,进行理性思考。
我们并没有告诉你去决策什么,而是告诉你如何做决策。
附录:概率论的基本原则
教导人们在不确定情境下的生存之道,使人们不至于因犹豫不决而不知所措。——伯特兰·罗素
理性决策的关键在于建设性地处理不确定性。这种不确定性通常用概率或几率来表达。只有当一组概率满足四条基本法则时,对不确定性的看法才是相容(一致/理性) 的,否则就是不相容(非理性) 的。
A.1 概率的基本概念与澄清
- 概率的定义与范畴:
- 概率是对未来不确定事件的数字判断。
- 关于过去事件的概率陈述(如“奥斯瓦尔德单独刺杀肯尼迪的概率”),应解释为我们在探寻真相时得到特定结论的概率,这本身是一个未来事件。
- 概率的解释:可解释为主观信念程度或客观频率,但所有解释都必须遵循相同的四条基本法则。
- 非理性的判定:通常只有在考虑两个或以上概率的组合时,才能判断是否非理性。单独一个概率值(只要在0到1之间)无法判定。
A.2 从神明到数字:概率论的起源
概率论起源于对赌博的评估。
- 历史案例:古罗马的距骨骰子:
- 距骨有四面,数字为1、3、4、6。维纳斯列指四颗骰子掷出数字各不相同的组合。
- 计算维纳斯列的概率:
- 计数法:共有
4×3×2×1=24种序列得到维纳斯列,总序列数为4^4=256。概率为24/256 ≈ 0.094。 - 连锁法:依次考虑每个位置得到不同数字的概率:
1 × (3/4) × (2/4) × (1/4) = 6/64 = 24/256。
- 计数法:共有
- 观念的演变:
- 古人多认为赌博结果由神明或命运主宰。
- 西塞罗在《论责任》中反驳了神佑说,指出掷骰子的结果是运气使然,并隐含了对长期频率的理解。
- 现代基础:计数法:
- 文艺复兴后,算术发展使得通过计数可能结果来计算概率成为可能(始于卡尔达诺)。
- 核心概念:
- 结果:一个试验(如多次抛硬币)的特定结果。
- 事件:结果的集合。可以是单个结果,也可以是多个结果的组合。
- 样本空间:所有可能结果的集合,记为 S。
- 空事件:不包含任何结果的事件,记为 ∅。其概念类似于数字“0”,对概率论体系至关重要。
A.3 概率论的四条基本原则
当所有基本结果可能性相等时,事件A的概率 P(A) = (A中的结果数) / (S中的结果总数)。
-
原则Ⅰ:界限原则
- 内容:
0 ≤ P(A) ≤ 1 - 解释:任何事件的概率都在0(不可能)和1(必然)之间。
- 内容:
-
原则Ⅱ:归一化原则
- Ⅱa:
P(S) = 1- 解释:样本空间中某个结果必然发生。
- Ⅱb:
P(∅) = 0- 解释:空事件(没有结果)发生的概率为0。
- Ⅱa:
-
原则Ⅲ:加法原则(针对互斥事件)
- 内容:如果两个事件 A 和 B 互斥(即
A ∩ B = ∅),则P(A ∪ B) = P(A) + P(B)。 - 解释:两个不可能同时发生的事件,其至少一个发生的概率等于各自概率之和。
- 推论:事件 A 与其补集(即“非A”,记为
Ā)的概率满足P(A) + P(Ā) = 1。
- 内容:如果两个事件 A 和 B 互斥(即
-
原则Ⅳ:乘法原则(条件概率的定义)
- 内容:在事件B发生的条件下,事件A发生的条件概率定义为:
P(A|B) = P(A ∩ B) / P(B),其中P(B) > 0。 - 等价形式(连锁原则):
P(A ∩ B) = P(A|B) × P(B) - 解释:事件A和B同时发生的概率,等于B发生的概率乘以在B发生的条件下A发生的概率。
- 内容:在事件B发生的条件下,事件A发生的条件概率定义为:
- 独立性:
- 直观定义:如果B的发生不影响A发生的概率,即
P(A|B) = P(A),则A与B独立。 - 正式定义:若
P(A ∩ B) = P(A) × P(B),则A与B相互独立。此定义具有对称性。
- 直观定义:如果B的发生不影响A发生的概率,即
A.4 违反概率原则的常见观念
许多直觉判断违背概率原则,导致非理性的概率评估。
-
合取谬误(情景效应) (Tversky & Kahneman, 1983):
- 表现:人们认为一个更具体、更有情节的事件序列(如“运动员染上毒瘾,参加治疗,然后获得冠军”)比一个更一般的事件(如“运动员染上毒瘾并获得冠军”)发生的可能性更高。
- 违反原则:这违反了原则Ⅲ和连锁原则。因为更具体的事件是更一般事件的子集,其概率不可能更大。
- 原因:添加的细节构成了一个“好听的故事”,增加了心理上的可信度,但逻辑上限制了其发生的可能性。
-
两种错误观念的组合:
- 赌徒谬误:认为一系列独立事件中,某个结果出现后,相反结果出现的概率会增加(如抛硬币连续出现正面后,出现反面的概率增大)。
- 未知分布谬误:在没有理由的情况下,认为所有人为定义的类别概率相等(如认为抛硬币两次,出现0、1、2次正面的概率各为1/3)。
- 非理性组合:同时持有这两种观念会导致概率评估的矛盾和不相容。
A.5 贝叶斯定理:用证据更新信念
贝叶斯定理提供了在获得新证据后,理性更新某个假设(H)的先验概率的方法。
- 公式:
P(H|数据) = [P(数据|H) × P(H)] / P(数据)P(H):先验概率,在看到数据前对假设H的初始信念。P(数据|H):似然度,在假设H为真的情况下,观察到当前数据的概率。P(数据):证据的边际概率,在所有可能假设下得到该数据的平均概率。P(H|数据):后验概率,在看到数据后,对假设H更新后的信念。
- 应用示例(袋子与筹码):
- 问题:两个袋子(A:70%红筹码;B:40%红筹码),通过掷骰子(2/3概率得A,1/3概率得B)随机选一个,然后抽出6黑4红。问来自袋子B的概率?
- 计算:利用贝叶斯公式比较
P(B|数据)与P(A|数据)的比值,最终得出从袋子B抽取的后验概率约为0.78。这表明证据(数据)的力量可以大幅修正先验信念。
A.6 对“巧合”与“显著性”的事后分析
许多看似惊人的巧合或“显著”发现,可能只是随机性的产物,尤其是在进行事后解释或选择性报告时。
- 巧合的本质:
- 关键原则:虽然一个特定的巧合事件概率可能极低,但**“发生某些令人惊讶的巧合”** 的概率却可能很高。
- 案例:一个人两个女儿的生日分别与祖母的忌日和生日相同。若孤立看,概率极低。但若考虑所有可能的亲属关系、纪念日、名人忌日等,发现某种巧合的概率就大大增加。
“当大量的事件、人和两者的互动随时间累积,几乎任何令人吃惊的事情都一定会发生。”——Diaconis & Mosteller (1989)
- 选择性终点/终止诡计:
- 手法:不预先明确“成功”的标准,而是在结果出现后,再将其定义为“神奇”的巧合。这极大地增加了“成功”的概率。
- 应用:常见于心灵学表演。魔术师或心灵学家通过灵活定义成功条件和终止规则,制造出令人惊讶的“超常”效果。
- 科学研究中的陷阱:
- 数据挖掘:在大量测量变量中,仅报告那些偶然达到“统计显著”的相关性,而不进行预先假设或重复验证。
- 案例:某学会会长报告孩子画圈方向(顺/逆时针)与日后患精神分裂症存在“显著相关”。但该结果很可能是在测试了数百个变量后,偶然出现的一两个显著关系之一,缺乏预测效度和可重复性。
- 理性评估的准则:
- 事先界定:在收集数据前,精确界定假设、检验方法和显著性标准。
- 重视重复:惊人的发现必须能在独立样本中重复验证。
- 考虑样本空间:评估巧合时,应思考所有可能被视作“特殊”的结果的整体概率,而非单个事件的概率。