梅西(全集)

梅西(全集)

加载中...

微信扫码,免登录解锁高速下载

如何使用 & 隐私说明

精彩点评

  • 梅西(全集)
    逆光奔跑
    推荐

    无愧经济诺奖得主,将晦涩的统计原理用生活中常见的司法、医学、人力资源表现出来,奠基式的用了噪声这个概念。解释了人类决策不如算法的原因,且差距和现实中的量化模型极为相似。这才是大师,擅长从司空见惯中找出科学规律。

  • 梅西(全集)
    奥吉尔维同志
    推荐

    善未易明,理未易察。以言举人,爱而知其恶;以人废言,憎而知其善。

  • 梅西(全集)
    Mr_J丨Tao
    推荐

    怎样在关键时刻做出正确的决定? 我们的一生当中有很多关键时刻,例如学习某项技能,高考选择志愿,毕业选择公司,恋爱选择伴侣,生病选择医院等等,如果把我们想要达到的目标,当做射中靶心的话,我们的射击前的决策就会影响最后的结果。当我们多次努力还是无法达成目标的时候,常常会问,问题到底出在哪里,是什么原因造成我们离目标越来越远? 《噪声:人类判断的缺陷》这本书给了我们答案。 《噪声》是诺贝尔经济学奖得主、“行为经济学之父”丹尼尔·卡尼曼携手决策领域专家奥利维耶·西博尼和卡斯·桑斯坦共同推出的新作,也是卡尼曼继《思考,快与慢》之后酝酿10年思考的巨作。他一直致力于研究“人在决策中为什么会出错”。传统经济学认为,人是理性的。但是行为经济学却指出:非理性,才是我们大多数行动的依据。为什么?因为人脑天生是懒惰的,不愿意多付出注意力,所以人脑会更依赖快系统直觉上的判断。通常我们做出决策,大家一般会认为大脑在思考的时候,直觉战胜了理性,产生了偏差,所以导致判断出错,但是在《噪声》一书中,卡尼曼系统的指出,噪声才是影响人类判断的黑洞,这本书通过系统的研究,揭示了判断出错的本质。 这本书的纸质版有515页,多达54.5万字,阅读起来非常烧脑,我简单总结一下全书内容,分为以下三个部分 噪声是什么,对我们有什么影响? 噪声在物理学上指一切不规则的信号,在生理学上指一切对人们的休息、学习、工作或者要听的声音产生干扰的声音,简单来说,就是我们不需要的声音,统称为噪声。这本书定义的噪声是指判断中不必要存在的变异。怎么理解呢? 比如,你请一些朋友去一家餐馆吃饭,有朋友说这家很好吃,另一个朋友说这家很难吃,你去是不去?去医院看病,一个医生说是需要住院检查,另一个医生说回去多喝热水,你听谁的?买股票,有人说明天会大涨,建议买入,有人说明天会大跌,建议卖出,你怎么做? 噪声无处不在,哪里有判断,哪里就有噪声。 上面举例是关于个人的决策遇到的噪声,如果是一个组织,一个国家,噪声的数量之大远远超过我们的想象。 个体判断中存在噪声的结果已经很糟糕了,但群体决策中的噪声危害更甚。对于个人来说,噪声导致的错误判断会让人损失时间,金钱,一个组织,一个国家会因为决策中的噪声损失惨重。就像新冠疫情依旧肆虐的今天,不同国家采取的防疫政策千差万别,面对同样的问题,有的国家让成千上万的民众付出生命代价,有的国家却能成为防疫典范。 如何判断哪些是噪声,它如何产生? 卡尼曼通过研究发现人类判断中的的错误一般会受两个因素影响,一个是偏差,一个是噪声,那么怎么区分偏差和噪声呢? 举例来说,如果我们有一把精度非常高的尺子,去测量一段绳索的长度,我们测量了100次,我们会得到100次的测量结果,把这些测量结果数据和绳索的标准值相比较会有一个正负值,这些正负值叫做误差,把这些误差相加,其结果是趋于零的,我们会得到一个反馈结果,这个结果就是偏差,告诉我们是总是测得比较长,还是比较短。偏差是可以预测的,从测量的例子来说,下一次测量可以根据反馈结果来修正,让结果离目标更近一些。 我们从这些测量的正负值中会发现,每次测量产生的误差不会完全相同,这种误差出现随机变异的现象,我们称之为“噪声”。当偏差彼此不同,噪声便应运而生。回到测量的例子,我们每一次测量的误差值是随机的,我们不知道下一次是测量误差是大还是小,想对于误差可以通过规律来预测和修正,噪声是无规律的,不可预测的。 这些噪声我们统称为系统噪声,系统噪声分为水平噪声,模式噪声和情境噪声。 水平噪声是指不同的人做出决策和所有人决策平均数的差异,简单来说就像是个人成绩和班级平均分的差异。100个人拿尺子测量绳索长度,会有不同的测量误差,这些误差产生的原因和个人的测量习惯,读数习惯等等相关。 模式噪声是指人在特定场景中的表现差异,我们喜欢用“一贯以来”评价某个人或者事,例如有些学生一直以来数学成绩非常好,但是语文成绩一般,一些学生物理成绩非常好,数学一般,在某一次考试中,数学成绩好的学生突然语文超过了数学成绩,物理成绩好的学生突然数学超过了物理成绩,这些某一次做法和自己一贯风格之间的差异,就叫做模式噪声。 情境噪声其实是模式噪声是一个分支,是指因为具体情境的不同而改变自己的行为模式,情绪是情境噪声的源头,情绪会对你的思维产生可预见的影响,它关系到你会注意环境中的哪些事物、从记忆中提取哪些信息,以及如何解读这些信息。例如我们会关注领导的心情去谈事情,这样的通过率会比较高,孩子会观察父母的心情来提出玩游戏看电视的要求等等。情绪、疲劳、天气、顺序效应等许多因素都可能导致同一个人在对同一事件做出判断时,产生我们不愿看到的变异。 我们怎么做才能抑制噪声 通过前面的两个部分,我们知道了什么是噪声,以及噪声如何产生,一旦意识到了噪声的存在,你就可以减少噪声,并减小其危害。此外,我们为“降噪”所做的工作往往能同时从根源上消除一些偏差问题。在本书的后半部分,卡尼曼通过一系列研究,解决了如何通过实施一系列技术性措施来测量和减少噪声,这些措施称为决策卫生策略。 一、提升判断能力。 不可否认,在面对人生中的一些关键时刻,总有一些人做出的判断要优于其他人,如果做判断的人受过良好的训练、更睿智且拥有正确的认知风格,那么他的判断也会产生更少的噪声和偏差。换言之,好的判断取决于你的经验、思维能力,以及你的思考方式。 一个好的判断者往往经验丰富且充满智慧,但他们也时刻保持着思维的开放性,愿意接纳新的信息。他们喜欢一个特殊的思维循环:尝试,失败,分析,调整,再试一次。 减少噪声的一个方法是,自己成为专家,或者去请教行业的专家,听取他们的意见,专业水平高的人做出的判断,噪声更少,偏差也更少。 二、中介评估法 在前面的测量绳索的例子中,我们知道平均值的误差是趋于零的,《噪声》一书中列举的大量实验证据表明,对多次预测取平均值会大大提高预测的准确性,对多个预测进行汇总的最简单方法是对它们取平均值。 对于个人来说,提升判断能力可以减少噪声和误差,对于组织来说,需要采用“评估-讨论-评估法”来作为减少噪声的工具。 写在最后,如果我们是一位管理者,那么我们拥有决策的影响越大,就越应该避免被噪声影响,因为判断失误的代价是巨大的,所以在做出决策之前,采取多钟措施消除噪声和偏差,但是如果只是决定明天是否早起,晚上是否参加聚会这样的小决策,就不如听从自己的想法吧。

  • 梅西(全集)
    Molly YUE 🌱
    推荐

    一生只有一次,也要考虑噪声。比如大多数人结婚、买房、生孩子都是一生只有一次或者几次,但是世界上人很多,可以跟别人比,吸取别人的经验,避免自己做出极端性的判断决策。

  • 梅西(全集)
    姜塬
    推荐

    统计学出生的更能理解 偏差和噪声的差别 偏差是规定算法或者规则下 不可避免的 噪音是各种方面 偏向于主观性可以调整的方向 一切的决策过程要减少噪音, 修复算法来减少偏差

  • 梅西(全集)
    Ocean
    推荐

    把不能归入系统偏差的偏差叫噪声,或者更为常用的随机误差,并且想去解决。在这个出发点上存在了一个致命的逻辑漏洞。 如果噪声(随机误差)可以通过系统的管理、流程、结构独立化判断解决,这还能叫做噪声(随机误差)吗?不又回到系统偏差的范畴里吗? 只能说是是创造了这个独立的概念,画好了靶子,然后当然可以把箭正中把靶心。 如何准确决策是个系统工程,还是回归到我们可以改变的系统误差,把更多的因素结构化,将不能解决的随机误差控制在一定范围内,才是正道。 而且这个正道大浪淘沙已经留下了经典之作《穷查理宝典》、《决策与判断》、《行为心理学》、《博弈论》等等可以给到更系统的参考。

  • 梅西(全集)
    吴刚
    推荐

    只要进行判断,就永远无法避免错误。错误的判断来源于两个方面,噪声和偏差。卡尼曼说“噪声是无规律的错误,偏差是系统性的错误。”        虽然阅读感受稍显枯燥,但这明显是一本非常有价值的著作,有决策需要的读者在这本书的帮助下,能够有效提高决策质量。简述几个想到的点。 一、广泛存在的噪声        有学者研究发现,不同法官对于同样案件的判罚存在很大的区别。对于同一个法官而言,有没有吃饱,上午还是下午,天气情况,甚至心爱球队的胜负都会对判决造成巨大的影响。        指纹鉴定的失误率非常高,以至于一些将指纹作为关键证据的案件可能出现严重的误判。        同一起车祸,不同核保员核定的保费常常会出现很大的差异。        同一个病例,不同的医生给出不同的诊断是很常见的情况。        一件事情对于世界发生的影响,取决于我们理解的角度,比如一场火灾,既带来了损失,又会因为重建创造新的就业岗位和价值。        信息排序可以让决策发生非常戏剧的变化。        (书中相关论述相当全面,非常有说服力。)        以上都是专业人士在专业领域做出的判断,由此可见,噪声广泛存在,我们不会是个例外。 二、噪声的价值        我在想,人类的判断机制经过了亿万年的自然选择,既然噪声是如此长期且客观的存在,那么必然有他有利于人类生存的一面。        人类没有办法穷尽因果链中的影响因素,任何模式化、系统化的解决方案都是在条件有限的情况下力求最优解。有效却很难避免出现误差。         多样性是非常重要的,也许噪声存在的价值在于让各种意想不到的“变异”、“突变”有机会逃过选择机制,让各种可能甚至是荒谬都有机会生发起来。        再有,消灭噪声的成本可能高到人类无法承受,在系统中,有时候我们宁可忍受一些甚至愚蠢荒唐的问题也不做改变,就是因为这可能是性价比最高的选择。解决这类问题,只能期待人类治理能力的整体提升。        还有,一些噪声的存在让决策存在不可预知的变量,这种不可预知,使得人类无法去利用制度的漏洞,这也是噪声存在的某种价值。 三、群体智慧效应与民主        群体智慧效应可以从一个角度证明为什么民主是最优解。 “1906年,达尔文的表弟、著名博学大师弗朗西斯·高尔顿(Francis Galton)在一次乡村集市上目睹了787名村民估计一头获奖的公牛的重量。没有一位村民准确猜到公牛的实际重量——大概是1198磅(5),但他们猜测的平均值是1197磅,与实际值仅相差1磅。村民们估值的中位数(1207)与实际值也非常接近。虽然村民个体的估值充满噪声,但全部估值的平均值偏差极小,就这一点而言,村民们是智慧的群体。”        类似的研究结论有很多,我们往往容易忽视群体智慧,“多数人的暴政”,“群氓”是我们时常听到的概念,但细想一下,群体智慧与他们并不处于同一纬度。作者说:“独立做出判断是发挥群体智慧的前提条件,如果人们不是自己做出判断,而是依赖于其他人,那么群体并不会更明智。” 四、我们用什么抗衡“算法”?        一些学者经过研究发现,对一件事情进行预测,对每个因素不加区分,赋予同样权重计算出的结果,最接近最优解。在很多情况之下,“算法”得出的结论都要比人类更加科学。        但作者指出了一种现象,人类有一种能力,可以在完全不相关的领域进行比较,比如一首歌与一座建筑,哪个让你更震撼;比如一本小说与一家餐厅,哪个令你更舒适。        再有,让人类按喜爱程度排序,比让人类给每个评价物打分,结果要客观的多。人类比较的能力比客观评价的能力要强的多。        任何算法都无法避免对某一人群的概念化甚至是歧视,所以算法只能靠近但绝不可能成为最优解。极端而言,用算法来形成决策,是对人类自由意志的蔑视与侮辱。        记得读过的《清单革命》,通过固化程序来减少复杂局面下可能出现的失误。这与作者所说的通过决策卫生来减少噪声的干扰是同样的逻辑。可以有效提高决策水平。        擅长做出决策的人有一些共同的特质。作者说“好的判断者往往经验丰富且充满智慧,但他们也时刻保持着思维的开放性,愿意接纳新的信息。”当面对一个观点或结论,好的判断者会去思考基本概率,运用跨学科知识进行验证,尝试将问题进行拆解,试问在何种情况之下答案才是肯定的,什么情况下答案有可能恰恰相反,并代入各种条件来思考可能的答案。“他们会问并试图回答一系列辅助问题,而不是给出一种直觉或整体的预感。”        同意译者所言,《噪声》是一本皇皇巨著,但通篇读下来,并无获得很多新知,可能是我悟性不足,还有一种可能是东方人在这种混沌领域本来就比西方人更加擅长。

  • 梅西(全集)
    李骥
    推荐

    非常棒的一本书,《思考,快与慢》之后的又一本力作,实用性也更强,直接指导决策。 随着年龄的增长,越来越发现,人与人之间的差异核心是思维方式的差异,而导致思维方式差异的背后是家庭背景、学习背景等一系列因素的影响。但无论哪种因素都有一个根源,那就是人对外界事物的理解千差万别,当然受到的是作者文中归类的几种噪音的影响。 作为一个独立的个人,我们首先需要对自己有一个客观的认识,但这非常难,因为人性是容易高估自己的(包括我自己),所以这也是为什么自我感觉良好的人非常多的原因。其次,我们要对周围的事物有一个客观认识,但这一步又很难,噪音太多了。其实很多事情都不是绝对的,我们需要有概率思维,比如有人抽烟抽了一辈子也没得癌症还活了90岁,有人不抽烟却英年早逝,这其实就是一个概率问题,不能拿小概率事件当披露,更不能因此“以身试错”,作者的观点很好不做危险的动作总没事。其实这本身就是一套思维方式。 如果不能做到规避噪声,那大概率受噪音的影响,决策就很容易偏离正轨,当然也许偏离了正轨也能成功,但方法是否可复制可持续且稳定? 我们需要的是一套思维方式,需要的是长期的稳定的可持续的方法,而非浑浑噩噩的没有独立思考能力的一生。

  • 梅西(全集)
    读月
    推荐

    塔勒布说,看书应该看出版20年以上的,但是丹尼尔卡尼曼的书除外!万维钢也是强烈推荐这位行为经济学鼻祖的书,每一本都是极品

  • 梅西(全集)
    Jacob🌍
    推荐

    诺贝尔经济学奖得主、《思考,快与慢》作者丹尼尔·卡尼曼新书,本书主要讲的是system noise,及如何减少机构中的noise,阅读本书需要对脑神经科学、心理学有一定基础…

  • 梅西(全集)
    志波
    推荐

    卡尼曼携《思考,快与慢》之余威继续推出的一本行为心理学书籍,在心理学附着科学分析的基础上荡开一笔,算是对前部大作的一种镶正和补充,在我看来,它对读者观念产生的影响不及前一部作品,也符合系列作品的规律:铜头铁尾豆腐腰。 噪声是通信技术领域的一个术语,意为广泛信息合成时产生偏离目标的因素。本书提出了噪声产生的三种方式:系统噪声、水平噪声和模式噪声,分析了三者发生的原因,以及它们之间的关系,大胆引入了一个科学公式,对意识本身进行了量化分析。这无疑是卡尼曼等人对理查德·费曼的一次呼应,后者曾经痛批过古典哲学的逻辑之弊,公式和定理是简洁优美的科学表达,卡尼曼是将心理学带上科学轨道的第一人,他的研究成果无疑遵循了费曼的原则。 香农定律强调了信息量是决定结果贴近真相的决定因素,卡尼曼在解决噪声污染的方法上,选定了“专业”、“规则”这些原则,正是对前述定律的延续和发展。中华文明之有:兼听则明,偏信则暗,无疑是对人性之弱点的洞见与应对,道理是相通的,能否做到“知行合一”不是一个一蹴而就的过程,需要躬身入局,事上磨练。 本书的重要意义,与其说它站在科学的桥头上指出了人性的顽疾,不如说卡尼曼用其强大的影响力让读者开始重视这个问题。

  • 梅西(全集)
    Ver 👾
    推荐

    大脑对我们的骗术,丹尼尔卡尼曼可算琢磨透了 「噪声就像地下室漏水,它之所以能被容忍,不是因为人们认为它是可接受的,而是因为它一直未被发现。」 这篇书评午休陆续写了几天,目的是当我再遇到相似内容,能迅速回忆起相关章节。遗憾的是微信读书的排版实在费劲也不能贴图,对于长文章写作实在不太友好。所以想要获得更佳体验,还请移步公众号。 如果用一句话概括本书,大概是:「离散度(或者说变异性)如何影响决策质量」。阅读过程中再一次让对统计学的理解仍然是一知半解的我,切实感受到它是有很多实际价值的。 作者引用了很多实际的案例,让对很多概念不再如此晦涩难懂,这是非常难能可贵的。所以大可不必被一些逼格甚高的书评吓退,比起什么「行为经济学」、「神经脑科学」,阅读无外乎需要一点初中数学的知识罢了。读的过程中要克服畏难情绪,看到比较难懂的内容反而要沉下来心来去啃,这正是让大脑主动消化最好的机会。 本书的主要作者是无需过多介绍的丹尼尔卡尼曼,「思考,快与慢」的作者。发现作者已经是一个年近90的老人,真的是让我大受震撼。当然因为珠玉在前,本书也有很多概念是「思考,快与慢」中的内容,看起来可能会稍有些重复,但是倒也不觉得啰嗦,毕竟我也没信心说之前看过的内容现在就已经完全捻熟于心了。 为什么噪音普遍存在? 为什么噪音普遍存在于这个世界呢?作者指出,其中一个原因是大多数人想当然的认为「其他人对世界的看法与我差不多」,这种信念也被称为「天真的现实主义」。表明我们认为自己的想法是大多数人认同或接受的,所以我们非常容易受到「知识的诅咒」的禁锢,比如在公司和其他部门合作过程中,因为彼此关系友善反而更容易觉得你所认为的「共识」,就是大家已经达成的共识。而不会注意到其实其他人的想法可能和你的想法其实没这么一致。 第二点来源于我们对分歧的不适,大多数人会努力削弱分歧带来的冲突感。就像明明知道两个面试官独立对一个面试者打分会更可能得出客观的结果,但是这样造成分歧和争议的风险更高,所以后面的面试更像是对不确定人选的一种审查,容易流于形式,而不再是对面试者做出客观的考量。 此外,哪怕我们经常做复盘还是不会留心到这种分歧的广泛存在。复盘通常复盘的内容是「错误」而不是「噪音」。如果真的犯了决策「错误」是很容易被识别的。但是「分歧」通常没有被认为是错误,所以没有被拖出来复盘,而是深藏在日常的每一个判断中。所以就算我们积极做复盘,还是只能复盘明显的错误。对于我们识别客观存在的分歧没有帮助。 偏差和噪音 本书伊始,作者奇妙的使用最小二乘法诠释了「偏差」和「噪音」,这也是本书的理论基础。作者引入了「均方误差」(Mean Squared Error,MSE)的概念,即个体误差平方的平均值。MSE的好处是,它可以同等对待正向误差和负向误差,并且不成比例地处理较大的误差(比如就A和B的智商和情商打分,A得9和3,B得到8和4,我们容易人为的放大9和8之间的差距,哪怕总的误差是一致的)。 这里的现实含义是:无论是正向还是负向误差,其错误造成的影响是累加的,不会互相抵消。实际场景中,多人对「一件事」做预测,噪音可以被消减(也是作者提到的「噪音审查」的实际应用)。一个人对「多件事」做预测,噪音会被累加。比如一个法官给a少判三年,给b多判三年,也不会让这个法官更公允。 可以写为:「总体误差(均方误差)=偏差²+噪声²」由图可见,在决策过程中,偏差和噪声可以互换,因此无论是减少噪声还是减少偏差,对减少总体误差而言意义是一样的。 此处,我们可能要进一步解释偏差和噪音的统计和现实含义。偏差代表误差的平均值,反映了所有判断均值和真值的差距。噪音则代表误差的标准差,反映了不同判断的离散度。 一个反直觉的事实是,无论偏差的大小如何,减少噪声都有益处。以图为例,和减少偏差不同,噪声的减少似乎使问题变得更严重了——预测更加集中了,而不是更准确了。84%的预测落入真实值的一侧,更多的推测落在了真实值右边。 但是我们发现,试图降低噪音的行动让偏差显得更明显了。如果我们用一种发展性的思维来看待问题,如果减少噪音让我们意识到偏差的程度很大,下次我们就更有可能修复这种偏差。如果不消除噪音,我们可能更难测量正确的偏差程度。 我们通常认为,噪音的影响比偏差更大,为什么这么说? 如果判断值中有84%比真值高,有16%比真值低,就表明偏差的影响较大——换句话说,如果判断呈正态分布,那么只有84%的判断都高于或低于真值时,偏差和噪声的影响才相等。如此大的偏差是相对好识别的,而当偏差小于一个标准差时,噪声就在误差中占主导地位了。 这也是为什么噪声不容易被人觉察,也很少被讨论,而偏差更容易被留心的原因。对于喜好归因的我们来说,当发现错误我们可能很容易发现偏差(决策中的方向性错误),但可能不会留意任何噪声。「只有用统计思维来看待世界,我们才会看到噪声,但这种统计思维并非与生俱来,因为我们往往更喜欢因果性的故事」。 水平、模式、情境,噪声的3种类型 理解噪音,或者说更好的记忆噪音,这里又要做一个拆解,噪音² = 水平噪音² + 模式噪音² = 水平噪音² + (稳定的模式噪音² + 情景噪音 ²) 简单来说,水平噪音指的是不同个体之间的特异性或者说做判的平均水平,反映了个体和均值之间的差异。比如有的老师得分比较严格,有的老师打分比较宽松。作者提到了一个比较极端的例子:是否给予庇护权决策就像轮盘赌,庇护申请指派给不同的法官后,「一位法官批准了5%的申请,而另一位法官却批准了88%的申请」。 所以这种噪音就像某种「人格特征」,你可以将决策者按「非常严厉」到「非常宽容」进行排序,就像人格测试里经常让你选择你乐于助人的倾向是怎么样的,外向程度又是怎么样的。 模式噪音则是不同个体对不同事件产生的交互作用和特殊的反映,通常反映了一些相对「模式化」的个人偏好和价值观,比如有的老师对更富有批判性的论文情有独钟,有的老师则对表达了独创性观点的论文情有独钟。 而哪怕是同一个人,也可能会对同样的事件产生不同的反应,这种反应来源于一种特殊的噪音——「情景噪音」。说直接点,就是有时候我们的决策就是看心情的……比如你的老师是曼联球迷,曼联赢球了导师就会倾向于给高分。但是这只是最朴素的解释,作者提出大脑的即时变化「不源于天气或分心等外部因素的影」,有时只是一种大脑自身运作的特征,所以对于情景噪音具体有哪些影响因子,我们仍然接近于一无所知。 但是幸运的是,情境噪声所占的比例通常小于个体间差异(即前文提到的「水平噪音」)。「你不可能永远是同一个人,随着时间的流逝,你远没有你所想象的那么前后一致;但令人欣慰的是,与其他人相比,今天的你更像昨天的自己。」换句话说,对难民来说,哪怕遇到的是心情不好的宽松法官,也比遇到心情很好的严厉法官强些。 我们与「准确判断」的距离 接着我打算简单来说的是,我们和准确判断的鸿沟,到底在哪里。 作者比较了专业人士、机器和简单规则预测的准确性,结论是:专业人士预测的准确性是三者中最差的。哪怕是最简单的规则也比专业人士的预测有参考性——其主要原因仍然是人类的判断存在噪声。 很多细节让我们感觉良好,但是对增强判断的准确性并无太大助益。我们通常因为自己洞察了更多细节而觉得自己比一般人判断力更强更有洞察力,残酷的真实是,一切都是错觉,你只是「噪音」比别人多上一些罢了…… 还有一个有趣的事实是,多变量预测模型不一定比单变量预测模型的预测效果好上多少。其原因是预测能力强的因素总是互相关联,或者说最有预测力的因素之间总有一些相关性,放到统计上来说,可能会造成多重共线性。一个有趣的案例是,「研究人员在评估被告再次犯罪的风险时,使用的模型只有两个输入变量,但该模型的预测效果与使用137个变量的模型相同。毫无疑问,这两个预测因素(年龄和先前被定罪的次数)与保释模型中使用的两个因素密切相关,而大量证据表明,它们与犯罪行为也是紧密相关的。」 让我想到我听过的一个段子,是说分析师凭业务经验写的预测逻辑有时在kaggle上的分数不一定比一些套了各种算法模型的预测效果差,原因可能是分析师凭经验找到了更优质的特征。当然,这不是说算法模型不好,算法模型的优势在于它可以不断学习,有时甚至能发现人类无法发现毫无关联的一些细节。而且算法预测通常比人类预测更为「公平」。换句话说,它可以更好的规避歧视和偏见。 此外,容易被忽视的事实是:「客观无知」是普遍存在的。我们总是基于一些说不清道不明的理由去做判断,且过度自信自己可以预测自己本没法预测的事情,忽略了有时候专家预测的准确性没有比黑猩猩好多少。原因是,一但我们了解事实,人类的因果思维可以对万事万物寻求解释,并且可以理直气壮的将其合理化并觉得它理所应当发生,进而高估了自己的预测能力。 为了解释这一现象,作者提到了一个叫做「常态谷」的概念,位于谷中的事情既不是完全可以预料的,也不是完全预料不到的。通常对于这些落于常态谷的事件我们都可以用因果性来解释,找到一个可以说服自己的理由时,我们就停止搜索原因,只有一些完全预料不到的事情会让我们真正感到意外(e.g.新冠疫情)。但是哪怕对于这样的事件,一但不确定性消失,我们依然会忘记它曾经让我们「不确定」过。 所以分析中的归因题很多都是伪命题,我们真的找到原因了吗?我们找到的原因有价值吗?我们该在哪一步停止搜索呢?我们只是在现有条件下,做到逻辑自洽,用编造的故事假装自己已经理解了世界的本质。 用作者的话说:「如果不想放弃对世界的理解,我们或许要不可避免地依赖有瑕疵的解释。然而因果思维和自以为了解过去的错觉,都会导致我们在预测未来时过分自信。」 这里作者对「显著」的解释非常浅显,很多对统计没有这么熟悉的人看到「显著」,第一反映就是这说明差别很大。但是实际上,「显著」只是表明,造成这样的差距是偶然产生的概率很小,也就是说现状不大可能是「随机的结果」。所以在极大的样本下,哪怕你的产品某项指标「显著」提升,可能变化仍然是微小。 削弱噪音影响的方法 终于到了翘首以盼的解答篇,可惜的是,我个人认为这一章给出的答案总体是不充分的。当然,想解决这么一个顽疾,非一日之功。作者提出的核心思路无非是两种:「甄选」和「汇总」,即选择最好的决策者,汇总这些决策者的决策。道理朴素,行之却未见如此容易。 当我们进行「汇总」时,有哪些值得注意的事呢? 首先,还是摒除个人的偏见,尽量对新观点做到积极开放。这意味着我们在判断时要主动搜索多方面的论据并考虑将其揉进自己的观点,而不是片面的只去看一些支持我们判断的论据,当发现自己错了,我们需要积极的接纳并改正自己的观点。好消息是,「开放性思维」是一种可习得的习惯,只要我们愿意不断修正自己的认知和观念。 其二是在决策中任命一名「决策观察者」,他需要对偏差警觉并提醒团队成员可能存在的偏差。但是这个职责本身就是反人性的,长期站在团队的对立面还不被暴打,需要很强的心理素质和颇高的情商,同时可能也需要上位者的一定保护。所以一个替代方案是至少整理出一份「偏差检查清单」,帮助我们去识别决策中可能存在的问题。诚然这样的清单需要根据组织的情况做个性化调整,也需要在长期维护中投注人力和心血,但是对于重要的决策,仍十分有价值。 第三是如果有条件让更多人参与决策,要确保每次判断相对独立。否则后来者就很容易受前人的影响从而形成「证实性偏差」。好比说,一个指纹鉴定人员鉴定前得知之前做出鉴别的人是业界大牛,他就很少会做出相反的判断;同时,只有极少数场景需要二次鉴别,如果告知这是一场二次鉴别,等同于告诉监测人员「这个指纹需要重新鉴别」。司法场景下,专家们尝试使用「线性序列揭露」控制鉴别人员获得的信息。 这里作者提到了一个有意思的事,70%以上的鉴定专家认为「认知偏差在司法鉴定中是一个令人担忧的因素」,但其中只有26%的人认为自己曾受认知偏差的影响。换句话说,我们承认大环境有问题,却拒不承认自己有问题。这份「迷之自信」恐怕又会催生更多问题…… 延伸到我们的生活中,当我们需要独立做判断的场景,我们要确保第二个做判断的人不知道第一个人的判断。当我们收集了足够多的独立判断并对他们取平均,就能很好的降低噪音带来的影响。 作者介绍了一种行之有效的汇总各个观点的方式——「德尔菲法」。而更简化更好实践的是「迷你德尔菲法」:「这个方法也被称为“评估-讨论-评估法”(estimate-talk-estimate),它要求参与者首先给出独立的(未公开的)评估,然后进行解释,并说明理由,最后根据其他人的评估和解释做出新的评估。共识性判断是第二轮中获得的个体估计的平均值。」 再说一说「甄选」,即选择更好的决策者…敢问,谁!不!想!呢!我本来觉得不值得做更多讨论。但是作者提到一个对预测者打分的系统,「布赖尔分数」,思路非常「统计」,所以还是分享一下: 「研究人员要求参与者对事件发生的概率进行预测,而不是仅仅给出“会发生”或“不会发生”这种非此即彼的答案。布赖尔分数可以绕过一个与概率预测相关的普遍存在的问题:预测者通过避免采取大胆的立场来对自己的预测做两手准备。」 一个比较有趣且生活化的案例是这样的:如果玛格丽特是一个天气预报员,她每天都告诉你明天有60%的可能性下雨,在一个500天中有300天下雨的城市,玛格丽特的预测无疑是非常准确的。再假设有另一名预报员尼古拉斯,他预测有300天下雨的概率是100%,有200天下雨的概率是0。 如果比较预测结果,这两位预报员都预测有X%的日子会下雨,看上去准确性一样,但明眼人都知道尼古拉斯更靠谱,他明确地告诉你明天需不需要带伞。反观玛格丽特,有点像某种正确无用的废话。它仿佛在告诉你:「明天不是晴天就是雨天」。是不是听君一席话胜读十年书,更胜听君一席话…… 如果你要在布赖尔分数得高分,你不仅要在平均水平上是正确的(即校准效果良好,500天中有60%的日子会下雨),而且要能够表明立场(即具有高分辨率,明天100%几率下雨,后天0%几率下雨;而不是模棱两可,二手准备)。布赖尔分数以均方误差的逻辑为基础,分数越低越好。这个概率其实不像概率,更像是你对这件事的信心指数。比如仍然对于下雨这个问题,假设明天下雨了,尼古拉斯判断100%下雨,玛格丽特判断60%下雨,而明天可巧不巧真下雨了,尼古拉斯的误差是0,玛格丽特仍有40%的误差。 此外,对于降低「噪音」,还有6个原则需要注意。 原则1:判断的目的在于准确性,而不在于个性化表达。即用具体的定义去代替模糊的语言。好比说,禁止开快车就不如禁止车速超过120km/h好,每个人对「快」的定义都不同。对于可以有共识的问题,不要增加模糊地带和人们思考的成本。 原则2:使用统计思维,采用外部视角审视个案。避免自己进入「因果论」的圈套,把一个case视为一系列相似事件中的一例,而不是特例来做判断。 原则3:对判断进行结构化,将其分解成几个独立的任务。这主要是从主观上避免我们「偷换概念」,对于一个复杂判断,我们把它拆解成很多因素,分别打分,就比较容易不被代入偏见。比如说一个面试者,与其直接让面试官去判断他有多适合这份工作,就不如让面试官去在多维度(比如进取心,沟通能力,分析能力……)打分来得更不带偏见。 原则4:抵制不成熟的直觉。用逻辑,而非直觉去做判断。 原则5:获取多位判断者的独立判断,再考虑汇总这些判断。主要是为了避免信息级联和群体极化效应,防止参会者受到他人意见的影响。 原则6:用相对判断和相对量表会更好。比如餐品按从0到10打分,有的人可能打8分就是他觉得非常棒了,另一些人恨不得打出个11分。使用「对比」而非绝对判断。 当然,屠龙的勇士有时终成恶龙。有一个词叫过犹不及,如果所有事都用算法来解决,我们将像工厂里的螺丝钉,很快就会失去热情。再比如虽然我知道找10个语文老师给1个学生的作文打分更精准,但是我们更需要考虑这种精准在大多数场景上,代价是否是我们所能承受的。 在我们与噪音的斗争中如何找到平衡点,恐怕会是一个长期的议题。

  • 梅西(全集)
    沐日德吉Jacobs. MJ
    推荐

    比《思考,快与慢》翻译得要好很多,依然是丹尼尔卡尼曼的著作,针对科学决策方面进行的探讨,值得品读

  • 梅西(全集)
    养生之道
    推荐

    第一遍就在似懂非懂中看完了。大概明白了水平噪声,情绪噪声和模式噪声的意思。不过可以肯定的说,西方国家在应对新冠疫情上的决策中,肯定是充满了噪声。

  • 梅西(全集)
    QueenLanlan
    推荐

    《噪声》这本户最早买了英文版,看了1/4,发现微信读书上了翻译版本,跳了中间的一部分内容,直接到了结尾处。其实丹尼尔卡尼曼的书感觉像大论文,有些句子和章节读起来像心理学或统计学教科书,有些像学术文章,这也谈不上抱怨,只是这种学术化的书籍好像不太适用于现在过于忙碌的我。总体还是推荐吧,谁让这是丹尼尔卡尼曼呢🤷‍♀️相比《噪声》我肯定更推荐《思考,快与慢》(英文版,微信读书上的翻译版无力吐槽)但没那么喜欢,坚持看下去的原因,也是书里提到了大量医学诊断中存在的分歧即“噪声”,这恰巧与最近脚伤后在医院经历的漫长治疗场景不谋而合,同样的MR光片,拿给不同的医生,看到的程度有轻有重,给出的结论也是大相径庭,有的让你立刻马上手术,有的轻描淡写家里恢复,有的建议康复治疗。作为病人的我,只感觉到无力和无奈,这还只是一个脚伤,难以想象一些其他的更严重的噪声导致的错误和不公。 在生活中消除噪声,必要性当然毋庸置疑。这可能涉及公平、人道、甚至生命,在一定程度上也能防止时间、金钱和人才的浪费。作者通过区分偏差(系统偏差)和噪声(随机分散)来开始工作。然后,这本书坚持不懈地专注于解释和记录由简单而无所不在的噪音错误所造成的冲击——以及决策者可以对此做些什么。它融合了故事、研究和统计数据,提出了一个个令人信服的案例,即噪音造成的损害至少与偏见一样多:破坏公平和正义,浪费时间和金钱,损害身心健康。 想知道如何要消除噪声的人可以直接跳到最后的一部分,作者建议,为了减少决策过程中的噪音,最好先请多个人做出独立判断,然后将他们聚集在一起解决分歧。他们解释了限制直觉和特殊偏好的指导方针和约束,长期以来已知可以减少偏见,也可以减少噪音。团体可以通过任命一名“决策观察员”、负责跟踪和指导互动的领导者或专家来解决噪音和偏见问题。它提供了一个冗长的问题清单,以帮助这些观察者——或其他任何人——诊断何时团体正在避免或注入会破坏他们决定的错误。正如卡尼曼所建议的那样,这种解决方案不适用于发表意见不安全的功能失调的群体。但它可以帮助决心做出正确判断的健康团队。总体来看,这本书适用于学者、政策制定者、领导、顾问这类人群,我觉得还是有不少可以借鉴的地方,是一本可以放在书架上很多年之后再翻的书,但短期内我不想再读。

Copyright © 2020 - 2022 Mitsuha. All Rights Reserved. 用户协议 · 隐私政策 ·