贝叶斯定理:让数学知识转化为经验的强大工具

本文介绍了贝叶斯定理如何将数学知识转化为经验,并应用于风险评估等实际问题,帮助我们更好地理解和应对不确定性。

原文标题:一文搞懂如何用贝叶斯定理让数学知识成为永久“经验”,网友直呼太强大了!

原文作者:图灵编辑部

冷月清谈:

本文介绍了如何运用贝叶斯定理进行“经验”学习,通过骰子的例子阐述了如何根据新的信息改变之前的判断。文章还以核电站事故为例,说明了在不确定信息下如何运用贝叶斯定理重新评估事件发生的概率,以及如何根据新信息修正判断,降低不确定性。贝叶斯定理不仅是数学理论,更是一种实用的思维方式,可以帮助我们更好地理解和应对现实世界中的风险和不确定性,持续积累经验,获得更加正确的知识。

怜星夜思:

1、文章中提到核电站事故概率的评估,不同立场的专家给出的概率差异巨大。在现实生活中,面对专家意见不一致的情况,我们应该如何运用贝叶斯定理做出更合理的判断?
2、文章中说'进步,就是积累经验,获取更加正确的知识。'那么,在使用贝叶斯定理进行'经验学习'时,如何避免先验概率中的偏见对结果产生过大的影响?
3、文章提到贝叶斯定理可以用来评估核电站事故的概率。除了核电站,大家觉得贝叶斯定理还可以应用在哪些其他领域?

原文内容

贝叶斯定理一旦与算法相结合,就不再是一套枯燥的数学理论或认识论,而变成了应用广泛的知识宝库,催生了众多现代数学定理,以及令人称道的实践成果。


正如它应用在数学方面,如何让知识成为经验,就给人带来惊喜!


所谓进步,就是积累经验,获取更加正确的知识。每当遇到新信息,我们需要拥有能够改变之前判断的勇气和沉稳的内心。这也是我们从贝叶斯定理中学到的。

来源 | 《用数学的语言看世界(增订版)》

作者:[日] 大栗博司

译者:尤斌斌


01

用数学来“学习经验”

下面我以特殊的骰子为例,来说明学习“经验”是怎么一回事儿。在学校学习概率时,老师们总是强调“虽然前一次掷骰子掷出 1,但是下一次掷骰子掷出任何一面的概率都是不变的”。也就是说,掷两次骰子时,两次的概率是相互独立的。例如,假设不是特殊的骰子,第一次掷出 1 的概率是 1/6,第二次掷出 1 的概率也是 1/6

不过,如果普通骰子和特殊骰子混在一起,分不清哪个是哪个时,第一次是否掷出 1 会影响第二次的概率。

普通骰子掷出 1 的概率为 1/6,假设特殊骰子掷出 1 的概率为1/2公式表示如下:

图片

正因为普通骰子和特殊骰子的数量相同,假设手头上普通骰子和特殊骰子的概率是五五开,即

图片

按照以上数据,掷出 1 的概率为

这个公式的导出方法请参考个人主页上的补充说明。因为其中混有容易掷出 1 的骰子,所以掷出 1 的概率为 1/3,大于 1/6

那么,假设第一次掷出 1,再次掷同一个骰子时,第二次掷出 1 的概率为多少呢?首先要注意的是,第一次是否掷出 1 会改变骰子是否特殊的概率。代入贝叶斯定理的话,

图片

因此,

图片

本来骰子是否特殊的概率为 P(普通) = P(特殊) = 1/2,但是如果第一次掷出 1 的话,那么骰子特殊的概率增至 3/4

一旦掷出 1,那么骰子中特殊骰子的概率会增加,所以再次掷同一个骰子时,掷出 1 的概率也会增加。计算公式如下:

第一次掷骰子时掷出 1 的概率为 P(掷出 1) = 1/3 ≈ 0.3。不过掷出 1后,再次掷同一个骰子时掷出 1 的概率增加至 P(掷出 1掷出 1) =5/12 0.4知道第一次掷出的是 1 后,骰子属于特殊骰子的概率从1/2 变成 3/4因此,按照以上数据,下一次掷出 1 的概率从 1/3 更正5/12这就是我所说的运用贝叶斯定理来学习“经验”。


02

核电站重大事故再次发生的概率


这个概率的计算方法与日本人正在面对的重大问题有关。我们有时候必须从不确定的信息中作出判断。例如在福岛第一核电站发生事故之前,据说日本的核电站发生事故的概率极小。但是,这次事故发生后才发现,原来核电站的构造如此复杂,连专家们都无法完全把握其安全性。也没有人准确地算出事故发生的概率到底是多少。这类似于刚才所说的骰子是否特殊,掷出 1 的概率到底是 1/2 1/6

我在报纸中看到,在这次事故发生之前,东京电力公司向日本政府提交的数据是核电站发生炉心熔融等重大事故的概率为一座核电站在10 000 000 年运行期内会发生 1 次事故。但是,日本开始使用核电站才不过 50 年。目前日本国内差不多有 50 座核电站,再加上最近刚建成的核电站,将核电站数除以运行年数,运行的核电站总计约为 1500× 1 年。那么,如果东京电力公司计算的概率正确的话,在过去 50年日本发生重大事故的概率为 1500/10 000 000 = 0.00015表示如下:

图片

另一方面,反对建造核电站的人们主张要重视发生重大事故的概率。我不知道他们估算的危险性有多高,不过假设他们担心每隔几个世代就会在日本的某地发生一次重大事故的话,难道是每 100 年发生一次吗?如果反核电运动人士主张重视的概率是正确的话,那么在过50 年间发生重大事故的概率为 50/100,也就是

图片

如果比喻成特殊骰子,“东京电力公司估算正确”相当于“拿到普通骰子”,“反核电运动估算正确”相当于“拿到特殊骰子”。正如特殊骰子掷出 1 的概率会变高,假设反核电运动的主张正确,那么发生重大事故的概率也同样会变高。

在接下来的计算中,为了计算方便,假设东京电力公司估算的概率和反核电运动人士主张的概率中有一个是正确的。当然,也有一种可能性是东京电力公司和反核电运动人士估算的概率都是错误的,所以这是一个很大的假设。不过我们的目的在于说明贝叶斯定理的使用方法,在这个假定下计算即可。

在事故发生前,很多人都相信东京电力公司的所言。至少允许建造核电站的政府官员判断核电站是安全的。假设相信东京电力公司主张正确的概率为 99%,那么记作:

图片

按照上述数据,计算 50 年之中发生重大核事故的概率为:

换言之,即使反核电运动人士强调 100 年间发生一次事故也很危险,如果他们正确的概率只有 1%,那么在日本国内某处发生重大事故的概率约为 0.005 次,估算为 10 000 年间发生一次。

然而在日本,核电站的运行时间才不过 50 年,就发生了炉心熔融。一旦发生了事故,我们需要重新审视东京电力公司那个正确概率99% 的主张。于是,运用贝叶斯定理的话,

图片

因此,

图片

事故发生以后,东京电力公司的主张正确率从 99% 急降为 3%。原因在于东京电力公司主张的事故概率 P(东电 事故) 0.00015,这个数值极小。虽然主张几乎不会发生事故,既然发生了事故,东京电力公司的主张正确率变低也在情理之中。运用贝叶斯定理,通过数学的语言来表现什么叫作“失去信任”。

那么在事故发生以后,下一次发生事故的概率又是多少呢?如果设备的运行率与事故之前相同的话,那么

反核电运动人士所说的每 50 年发生 0.5 次,也就是每 100 年发生 1 次。为了方便说明贝叶斯定理的使用方法,简单地假设“东京电力公司和反核电运动人士估算的概率中有一个是正确的”。当然,也有一种可能性是东京电力公司和反核电运动人士估算的概率都是错误的。而且,因为 P(反核电 事故) = 0.5 或者 P(反核电) = 0.01 等数值是我自己随意计算得出的数字,不能这个按照表面意思来理解这些计算结果。

这次事故发生半年后,大概在 2011 年 10 月 17 日,东京电力公司重新公开发表了福岛第一核电站再次发生炉心熔融的概率,改为每5000 年发生一次。在日本国内约有 50 座核电站,所有核电站重新运行的话,在日本某地发生重大事故的概率为每几百年发生 1 次。

当我们获取新信息,只要根据这些新信息来修改概率,就可以降低不确定性。这就是学习“经验”。继续使用核电站存在风险。另一方面,对于依赖大量进口化石燃料的日本来说,停止运行核电站同样存在风险。

而且,当然还要考虑化石燃料对地球气候变化的影响。比较各方面的风险后再作判断,也就是说,计算风险需要正确理解概率。

所谓进步,就是积累经验,获取更加正确的知识。每当遇到新信息,我们需要拥有能够改变之前判断的勇气和沉稳的内心。这也是我们从贝叶斯定理中学到的。



  推荐阅读

《用数学的语言看世界(增订版)》

作者:[日] 大栗博司

译者:尤斌斌


美国加州理工学院理论物理研究所所长,日本东京大学Kavli数学物理学联合宇宙研究机构研究主任 大栗博司 教授


突破传统数学教育教学顺序、方式 / 以“语言思维”讲解数学核心概念、原理 / 回归“基本原理”重新认识数学本质

02


《贝叶斯的博弈:数学、思维与人工智能》

作者:黄黎原

译者:方弦


法国数学类科普书、大学数学参考及教材类图书畅销书目,在机器学习、人工智能、逻辑学和哲学等众多领域中,探索贝叶斯定理蕴藏的智慧与哲理。


贝叶斯定理一旦与算法相结合,就不再是一套枯燥的数学理论或认识论,而变成了应用广泛的知识宝库,催生了众多现代数学定理,以及令人称道的实践成果。

02

《趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学》

作者:[美] 威尔·库尔特(Will Kurt)
译者:王凌云

本书用十余个趣味十足、脑洞大开的例子,将贝叶斯统计的原理和用途娓娓道来。你将从直觉出发,自然而然地习得数学思维。读完本书,你会发现自己开始从概率角度思考每一个问题,并能坦然面对不确定性,做出更好的决策。

其实,面对专家意见不统一是常态。我的想法是:先别急着站队。看看能不能找到更权威、更中立的第三方评估机构的报告。如果找不到,那就自己做功课,尽量搜集各方的数据和论证,然后用贝叶斯定理来更新我自己的先验认知。说白了,就是不要迷信权威,要有自己的判断!

我理解的“经验学习”其实就是一个不断迭代的过程。刚开始,我们的先验概率可能比较粗糙,甚至带有偏见。但没关系,通过不断地学习新的数据,我们的后验概率会逐渐逼近真实情况。所以,关键是要保持开放的心态,勇于承认错误,及时修正自己的先验认知。

从贝叶斯定理的角度看,专家的意见其实就是一种条件概率。关键在于,我们如何评估这个条件概率的可信度。例如,如果一个专家过去多次预测失误,那么我们可能需要降低他对此次事件预测的信任度,也就是降低相应的条件概率值。再结合我们自己对事件的先验判断,就能得到一个相对更合理的后验概率。

我觉得可以结合A/B测试来减少偏差,先小范围进行测试,用测试得到的数据更新先验概率,然后用更新后的概率来做决策。这样即使初始先验概率有偏差,也能在迭代中逐渐修正。

这个问题问得好!先验概率确实会影响最终结果,为了避免偏见,可以尝试以下方法:1. 尽量选择客观、全面的数据作为先验概率的来源,避免主观臆断;2. 如果对先验概率没有把握,可以使用’无信息先验’,即假设所有可能性都是等概率的;3. 不断收集新的数据,更新先验概率,随着数据量的增加,先验概率的影响会逐渐减小;4. 进行敏感性分析,考察不同的先验概率对结果的影响程度。

贝叶斯定理的应用简直不要太广!比如,在医学诊断中,医生可以根据病人的症状和检查结果,运用贝叶斯定理来判断病人患某种疾病的概率;在垃圾邮件过滤中,系统可以根据邮件的内容特征,运用贝叶斯定理来判断邮件是否为垃圾邮件;在金融投资中,投资者可以根据历史数据和市场信息,运用贝叶斯定理来预测股票价格的走势。

从更技术的角度来说,贝叶斯方法在机器学习领域应用广泛,例如贝叶斯网络、朴素贝叶斯分类器等等。这些算法能够根据已知的先验知识和观测数据,自动学习和预测未知事件的概率分布。简单来说,就是让机器像人一样,通过不断学习来提升自己的判断能力。

这个问题很有意思!我觉得可以这样考虑:首先,我们需要了解不同专家背后可能存在的利益相关或者知识背景差异,这可能会影响他们对先验概率(Prior probability)的判断。然后,收集更多的证据,比如历史数据、实验结果等,用这些证据去更新先验概率,得到后验概率(Posterior probability)。最后,根据后验概率做出决策。当然,如果实在无法判断,可能需要引入更多的专家,或者采用一些综合评估的方法。

我想到一个更有趣的应用:相亲!我们可以把对方的各种条件(学历、收入、性格等)看作是新的信息,然后用贝叶斯定理来更新我们对TA是否是理想伴侣的概率判断。当然,这只是个玩笑,相亲还是要靠感觉的,哈哈!