概率论和认知心理学:条件概率

为什么概率题常常反直觉?带你了解我们认知系统的局限性。

Fooled by Randomness》是著名思想家塔勒布(Nassim Nicholas Taleb)的巨作“不确定性三部曲”中的第一本。在书中,塔勒布给出一道让很多医生汗颜的概率题,只有不到20%的医生给出了正确答案。

题一:假设有一种疾病,它的发病率是0.1%,也就是说平均每1000人中有一人患有该疾病。针对该疾病有一个测试,它的假阳性率是5%,没有假阴性。现在有一个人的测试呈阳性,请问他患病的概率是多少?

大多数人会说95%,并且认为0.1%的发病率是没有用的条件。做错了的人其实不用不好意思,正如塔勒布在书里论证的,人类在基因上是概率盲人。

以诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)为首的心理学家认为人的大脑有两个系统:快速、直觉且情绪化的系统一,以及较慢但擅长逻辑思考的系统二。系统一和系统二到底哪个是更好的决策系统?要看情况。实际情况是,人们常常用系统一来做快速决定。著名畅销书作家格拉德威尔(Malcolm Gladwell)在《Blink》一书论述到,基于直觉的快速决定往往胜于反复的推敲。他从军事、医疗、艺术、体育等多个领域中引证来支持他的这个观点。从进化论来说,这个观点合情合理:我们的祖先靠快速的决定来躲避自然界中随时可能突发的危险,那些还在用系统二做逻辑推理的猿人早就成为美洲狮的大餐了。

问题是,从进化论的角度出发,概率论对原始人来说,对提高他们的生存和繁衍后代的几率没有什么用,所以我们的系统一对概率的直觉非常的弱。这也是为什么──正如塔勒布书里提及的──很多受过高等数学教育(包括概率论)的从事金融交易的专业人士也会经常在概率上犯低级错误,因为他们只启动了系统一。塔勒布承认他也不例外,只是他知道自己的局限性,时时提醒自己不要“感情用事”而犯错。

系统一的概率误区比比皆是,比如随机事件的独立性:在连着掷出十次硬币朝上之后,下一次硬币朝上的概率还是50%,这一点中学生都明白(实际上是背住了),但在直觉上还是难以接受。我们的系统一没有办法对概率进行抽象思维,只好借助于一些启发(heuristic),比如可得性启发(availability heuristic):越容易想到的情境,人们认为这样的事发生的机率也越高。如果你身边的不少人都患有某种慢性病,你就会觉得这种慢性病的得病率比实际的高。

现在回到一开始的那道概率题,它让人困惑的原因是系统一对条件概率基本无感。到底什么是假阳性率?百度百科上定义为:无病,但根据筛检被判为有病的百分比。它的严格数学定义应该是用条件概率:P(测试为阳性|无病)。而题目所问的,一个人在测试阳性的情况下患病的概率,写成条件概率是:P(有病|测试为阳性),也等于1-P(无病|测试为阳性)。为什么大多数人不假思索(实际上是用了快速的系统一)的回答都是95%?这是因为系统一对条件概率根本无感,它把P(A|B)当作是P(A∩B)了,也就是说,它把假阳性率理解成无病“并且”测试为阳性的概率。在这个错误的假设下,P(A|B)=P(A∩B)=P(B∩A)=P(B|A),那么P(无病|测试为阳性)=P(测试为阳性|无病)=5%,最终的答案就是1-5%=95%。其实系统一的整个推断过程是一个快速直觉的判断,根本不做上述(错误的)数学推导,只有我们把数学推导列出来后,才能找到系统一的错误。

条件概率对人们来说是一个难于理解的数学概念,和我们的系统一格格不入。这也是为什么很多人都困惑于著名的Monty Hall problem,因为它太反直觉了。

题一的答案实际上是2%左右,非常低的一个数字,我这里不仔细讲解解题过程了。也就是说,如果测试呈阳性,患病的概率只有2%,这个结果也是反直觉。你肯定要惊讶了,这样的测试有什么用?是的,5%的假阳性率是很烂的,即便是1%的假阳性率,测出阳性后还要多测几次才能确诊。反之,当人们得出95%的错误答案的时候,因为答案符合直觉,就不去质疑了。

要想做出正确的决策,我们要能估计系统一给出的答案的正确性,在存疑的时候调动我们的系统二来做逻辑分析,这样结合两个系统才能增加决策的正确性。用系统一来估计系统一的正确性,看似有点自相矛盾,但是如果熟知系统一的局限性,我们还是可以给自己一个小预警的。做题一时,不随意地走直觉,把数学式子列一下,估计经过高中数学训练的同学还是能够做对的。

为了充分地显示我们对条件概率的局限性,我编了一道概率题:

题二:小明不怕淋雨,下雨的时候,平均十次里只有一次打雨伞。这天,小明从外面回来时带着雨伞,在不去检查雨伞是否被淋湿的情况下,请你估计外面正在下雨的概率是多少?

我想有人可能会说90%吧。正确答案是:条件不足。猜测是90%的人们大概是这样想的,小明打伞是小概率事件,那么小明都打伞了,下雨的概率肯定很大,所以系统一就大概齐地做了一个1-10%的运算,咋一想好像也是那么回事:P(下雨|带雨伞) = 1- P(带雨伞|下雨) ,这当然是错的。

这两道题的错误解是一个道理,P(A|B)不可能只从P(B|A)推出来,不论是P(A|B)=P(B|A),还是P(A|B)=1-P(B|A),都是不对的。系统一没有办法理解条件概率,它只能感性地估计概率的大小,然后试图在数字上能够凑出一个貌似合理的推理,这就是人类的认知对于概率论的一个局限性。下次碰到概率问题的时候,就不要折磨自己的系统一了,把纸笔拿出来,让我们的系统二来做理性的分析,这样才可以避免直觉带来的错误。

参考书

还是那句话,尽量看英文原版,没有条件的可以参考以下译本。

Copyright @2020-2022 Writingisleading.com All Rights Reserved

概率论和心理学