帕隆多悖论:两个看似“必输”的游戏,为何能组合出“赢”?

两个会输钱的游戏,巧妙组合竟能赢?帕隆多悖论揭示数学思维的魅力。

原文标题:豆瓣8.7,这才是学好数学的底层能力:思维能力!

原文作者:图灵编辑部

冷月清谈:

文章首先澄清了数学学习中对“天赋”和“直觉”的误解,强调 持续深入的逻辑思考才是掌握数学的关键。随后,文章详细介绍了著名的“帕隆多悖论”:两个独立进行时都将导致亏损的游戏A和游戏B,若以特定方式巧妙结合,竟能转变为有利可图的游戏C。

游戏A是胜率略低于50%的简单亏损游戏。游戏B的胜率则基于玩家本金是否为3的倍数而动态变化,长远来看同样亏损。然而,当游戏A和游戏B以50%的概率交替进行时,组合成的游戏C却出人意料地使玩家本金稳定增长。文章深入解析了这一反直觉现象的数学原理:关键在于 游戏状态的动态切换改变了系统在不同输赢概率下停留的比例,使得整体期望值由负转正。通过马尔可夫链和状态转移图,文章解释了组合游戏如何有效避免了单一游戏中的劣势,从而在宏观上实现了获胜。这一悖论不仅挑战了直觉,也证明了复杂系统分析中,深层结构和互动模式远比表面概率重要。

怜星夜思:

1、文章开头提到“天赋”和“直觉”是事后诸葛亮,学数学重在刻意练习和深度思考。那你们觉得,在数学学习或者其他复杂问题的解决中,直觉真的就一无是处吗?它和刻意练习到底是什么关系?
2、帕隆多悖论的核心是两个单独赔钱的游戏组合起来反倒能赢。大家觉得,现实生活中有没有类似“帕隆多悖论”的例子,比如在投资、管理或者日常决策中,某些看起来单独不利的策略,组合起来反而效果奇佳?能举个例子或者分享下你的脑洞吗?
3、游戏B的胜率与本金是否为3的倍数有关,这种“状态依赖”是帕隆多悖论的关键之一。除了本金的倍数,还有哪些因素或者说“状态”的变化,可能会在真实世界中导致这种反直觉的“输输得赢”现象呢?大家可以天马行空地想象一下。

原文内容


当人们谈论那些天才数学家时,经常会冠之以“天赋”“神秘的直觉”等美誉。关于数学的讨论中也尽是诸如“搞数学的有没有天分最重要”“做数学研究得有那种感觉才行”等论调。你的身边应该也有一些悲观的家长吧,他们总是觉得“我家孩子根本就不是学数学的那块料……”


但是, 在我看来, 这些都不过只是些宣传口号罢了。“天分”“感觉”等,说这话的人都是事后诸葛亮。那些被称为“直觉”的灵光一闪,不过是早已得出答案的当事者的事后说明而已。他们其实早已窥见了解决问题的正确途径,只不过是换种说法,把解决的过程称为“直觉”。当你真正面对那些无法解答的问题时,我想这种神乎其神的所谓“直觉”的力量,根本不会有什么帮助吧!


真正的天才,并不是说他有才华就会大放光彩,能够受人瞩目一定是因为他进行了大量的思考和研究工作。在数学的领域里,没有所谓“直觉”这样的捷径。最终能够通往正确答案的唯一道路,就是要有韧性,要不断地反复去思考问题之所在,耐心地追寻其中的逻辑。

来源 | 《数学思考法:解析直觉与谎言
作者 | [日]神永正博
译者 | 孙庆媛

问题 : 两人手中分别持有 100 元的本金,两人进行以下规则的游戏。如果将游戏 A 与游戏 B 结合,那么输赢情况会如何?


游戏 A

有 48% 的概率获胜,使本金增加 1 元。

有 52% 的概率输掉,使本金减少 1 元。


游戏 B

本金数额为 3 的倍数时,获胜概率为 1%。除此之外,获

胜的概率为 85%。

获胜本金增加 1 元,失败则本金减少 1 元。

很明显,游戏 A 中输的概率是很高的。而游戏 B 中,本金的数额有 1/3 的概率是 3 的倍数,此时获胜概率仅为 1%,几乎会必定输掉游戏。本金数字有 2/3 的概率不是 3 的倍数,此时获胜的概率为 85%。但是一旦赢了,本金增加,几次过后本金又会变成为 3 的倍数。所以,游戏 B 输的概率同样很高。既然游戏 A 和游戏 B 输的概率都很高,那么将游戏 A 与游戏 B 结合,结果自然也是输多赢少!

容易输掉的游戏 + 容易输掉的游戏 = 容易获胜的游戏?

两个不利于获胜的游戏,无论如何组合,也无法改变不利于获胜的情况吧。一般人这样想是非常自然的。

但 是, 马 德 里 康 普 顿 斯 大 学 物 理 系 的 胡 安· 帕 隆 多(Juan  Parrondo)教授却提出了异议。如果将两个容易输掉的游戏 A组合,则可以得到一个容易获胜的游戏。单独玩游戏 或游戏 B,结果均为输多赢少,但是如果将游戏 A巧妙组合,在不改变任何其他条件的情况下,就可以将游戏结果变为赢多输少。真是令人难以置信!

先总结下前文信息,游戏 的规则是这样的:

游戏 A

有 48% 的概率获胜,使本金增加 1 元。

有 52% 的概率输掉,使本金减少 1 元。

48% 和 52%,虽然从数字上看来两个概率相差不大,但是如果一直玩下去,结果就会输多赢少。因为在这种由偶然性支配的游戏中,概率上的微小差异都会对结果产生巨大影响。

我们来看一下如果将游戏 连续进行 400 次,本金会如何变化(图 132)。在 48% 胜率的支撑下,玩家的本金最初还是有所增加的。但是,随着游戏次数的增加,本金则越来越少。游戏中获胜的概率与输掉的概率相差并不大,但多次进行游戏后,本金最终还是会减少。

这里需要说明一下,图 132 是我用计算机程序模拟得到的结果。大家也可以用其他方式验证,比如用一个略微不均衡的硬币(正反面概率不同)就可以。

下面我们来看游戏 B,游戏 的规则有了一些小变化。游戏 中,获胜概率会依据玩家本金的数额(是否为 的倍数)而变化。

游戏 B

本金数额为 3 的倍数时,获胜概率为 1%。除此之外,获

胜的概率为 85%。

获胜本金增加 1 元,失败则本金减少 1 元。

游戏 的胜负概率,需要依照当下持有的本金数额,计算上较为繁琐复杂。这里我还是使用计算机程序来模拟,可以得到大致的结果。图 133 为游戏 进行 400 次后的本金变化结果。

当本金数额不为 的倍数时,获胜的概率为 85%,我们可以举例子来说明这一点。假设当前的本金是 元,不是 的倍数,因此玩家此时获胜的概率高达 85%。此时如果玩家决定参与游戏 B,就有 85% 的概率赢,本金就增加 元,变成了 元。这时,也仍然不是 的倍数,因此玩家下一轮再进行游戏 的话,仍然会有 85%的概率将本金增加到 元。

但是,当本金变为 时,因为 是 的倍数,此时玩家获胜的概率仅有 1%。这就意味本金基本会减少为 元。非常有趣的是,曲线此时呈现出了上下波动的现象,即本金“增加 元、减少 元”的重复循环。在图 133 中,我们可以很明显地观察到这种现象。

不过,随着游戏的进行,偶尔也会出现连续获胜或连续输掉的情况,这时曲线就会暂时摆脱波动循环。但是,从总体而言,本金减少的概率还是高一些,因此本金会逐渐减少下去。

在具体分析了游戏 和游戏 之后,下面就是我们本节所要探讨的焦点问题:“组合游戏 和游戏 B,是否可以改变胜败概率。”

组合的结果

根据目前的信息,可以将游戏 和游戏 的规则用图 134 的树状图来呈现。

在前文的计算机模拟中,不论是游戏 还是游戏 B,本金最后都是减少。在这种不利的条件下,帕隆多教授究竟想出什么策略可以扭转局势呢?

令人惊讶的是,他的思路非常简单:“将游戏 A、游戏 组合,50% 的概率进行游戏 A50% 概率进行游戏 B。”也就是说,游戏 A和游戏 分别以 50% 交替进行。帕隆多教授认为,只要将游戏如此组合设计,就有可能使本金呈现增加的趋势。

按照帕隆多教授的思路,下一轮进行哪一个游戏,是由概率决定的。这个概率分别设计为 50%,这就意味着增加游戏次数的情况下,基本都不会出现连续进行游戏 或游戏 的情况。我们可以再用计算机程序进行 400 次模拟,其中游戏 进行 200 次,游戏 同样也是 200 次。

不过,原本输多赢少的游戏 A、游戏 B,以 50% 的概率交替进行,就可以让本金增加吗?怎么想都觉得不太靠谱。

我们马上用计算机程序模拟来看一看结果。将游戏 与游戏 B 以 50% 的概率交替进行的形式组合为游戏 C,模拟运行 400 后,就得到了图 135 的结果。为了与游戏 A、游戏 对比,图中也加入了单独运行游戏 A、游戏 时的结果。

图 135 中,最上方的曲线就是游戏 的模拟结果。游戏 是游戏 和 的组合,但是游戏 的本金变化趋势却与 和 截然不同。游戏 中的本金是上涨的,而且不是增加一点点儿,是呈现出了整体增加的趋势。

仅仅是让游戏 A交替进行,就导致了颠覆性的结果。这究竟是什么原理?

我们先来用图 134 确认一下游戏的情况。但是图 134 的树状图,只用来说明“进行游戏 A、游戏 的结果如何”。并不能解释组合 A和 后的颠覆性结果。这是因为,由游戏 A、游戏 组合而成的游戏 是“动态”的。

因此,随着游戏次数的增多,我们需要考虑游戏 中“趋于固定的结果”(这种状态称为稳定状态)。

图 136 呈现了游戏 AB各自的变化。这个状态图中涵盖了游戏 AB所有可能的状态,即本金除以 后余数为 01的情况,以及胜负概率、游戏如何继续的情况。

下面我来具体说明一下这个状态转移图的解读方法。因游戏 A、 B 的图的构成机制是相同的,所以这里只选取运行机制更为复杂的游戏 进行说明。

在游戏 中,当本金除以 的余数为 时,游戏的胜率只有1%。若游戏获胜,则本金增加 元,增加后的本金除以 的余数变为 1。这就是图中 和 之间标有 1% 箭头代表的意思。

当本金除以 余数为 时,此时本金不能被 整除,所以胜率变为 85%,如果获胜,则本金增加 元,增加后的本金除以 的余数又变为 0。这就是图中 和 之间标有 85% 箭头代表的意思。

以上分析中选取的都是 1%85% 的获胜概率,输掉的情况原理也是同样的。类似这样,当前状态在概率的影响下变为下一种状态,这种情况在概率论中称为“马尔可夫链”。

将游戏 A的状态变化的概率相加,然后除以 2,就可以制作出游戏 的状态转移图。

这种状态转移图表示的是进行一次游戏时的状态变化,当游戏次数增加时,余数分别为 01的概率又会有什么变化呢?将 01比例为 15的游戏进行 200 次,其变化情况如图 137 ~图 139 所示。

这里需要说明一下,初始状态中把余数为 01的比例设置为 158,并没有什么特殊的含义。初始状态选择差异较为明显的比例,会使后续的变化更清晰可见。初始状态设定为其他比例也是完全可以的。

观察图 137 ~图 139 的变化可知,在三个模拟测试中,虽然最初三者的比例有所波动,但最后都分别稳定在了一个固定的比例上。

获胜的原因

图 137 ~图 139 中赌局 AB各自的状态变化有一个共同规律,那就是本金除以 的余数为 01的情况,都是分别逐渐趋向一个固定比例。我们可以用表 来总结一下这个固定比例。

可 以 看 到, 在 游 戏 中, 余 数 为 01的概率都同样是33.3%1/3)。而游戏 中,余数为 的概率是 43.0% ;余数为 的概率是 7.8% ;余数为 的概率是 49.2%。在游戏 中,三者分别为35.4%22.7%41.9%,已经非常接近了(稳定状态)。

这里正是关键所在!请注意,游戏 的稳定状态下,三者的比例并不等于 和 相应数值相加后除以 的值。

要判断游戏的条件是有利还是不利,还需要计算出游戏进入稳定状态后的期望值。计算结果显示,游戏 A的期望值均为负数,而游戏 的期望值是正的。如图 140 所示,对于游戏 AB中的任意一个游戏而言,将本金为 的倍数时胜率设为 p,不是 的倍数时胜率设为 p,只要将 p、 p设置为特定的一组值,就可以在游戏中获胜。

计算 p、 p各自概率所对应的期望值。将期望值为正的区间(获胜的区间)与期望值为负的区间(输掉的区间)用颜色加以区分,就可以得到图 141。图中上方(白色区域)为获胜区间,下方(灰色区域)为输掉的区间。通过判断 p1、 p组合的值落入上方区域,还是到了下方区域,游戏的胜负情况也就一目了然了。

如图 141 所示,游戏 的结果为 p p 1 2 = = 0.4848%),同样游戏 中 p0.011%)、 p0.8585%),图中这两个游戏的对应的小黑点均位于输掉游戏的区间。

而游戏 C,即将游戏 和游戏 B“以特定的比例组合在一起”时,相应的 p、 p值的组合也应当位于连接这两点的线段上。

游戏 由游戏 A、游戏 分别以 50% 的概率组合而成,因此游戏 p1、 p的位置如图 142 所示,为连接游戏 和游戏 线段的中点。

很明显,代表游戏 的点落在了白色获胜区间内。可见,将两个输多赢少的游戏组合起来,确实可以得到一个赢多输少的游戏。实际上,这个意外的反转,是由图中游戏 灰色区域的凹陷部分导致的。这也正是帕隆多悖论的奥秘所在。

自帕隆多悖论被提出之后,陆续有一些其他的案例被证明适用于该理论,这些案例都是通过将条件不利的游戏进行组合从而构造出条件有利的游戏。看上去条件不利的游戏,其中其实也隐藏着意外的反转之道。


数学思考法:解析直觉与谎言

作者: [日]神永正博

译者:孙庆媛

《简单微积分》作者神永正博经典著作!


分析信息真正价值 / 拆解转化复杂问题 / 破除思维定式陷阱。


通过用数学思维解析实际生活案例、公众认知中的错误直觉、数学经典名题等方式,由浅入深地传授了分析数据信息价值、辨别谎言、拆解转化复杂问题、抓住事物本质的思考之法,同时讲解了相关的数学知识与理论,可以有效提高理性思维、判断与解决问题能力。




《可变思考:数学与创造性思维》

作者:[日]广中平祐

译者:佟凡

日本数学大家、菲尔兹奖得主广中平祐著作!稻盛和夫力荐,呈现数学家观察事物的独特视角与思考方式。


1.稻盛和夫力荐,日本累计销售10万册!

2.菲尔兹奖得主理解“复杂”与“变化”的巧妙视角,用数学的智慧探索创造力的本质

3.讲述创造性思维的本质与根源传授学习、研究、教育中的创造性思维的模式与方法


直觉?那不就是玄学嘛!就像我玩游戏,凭直觉选英雄,结果把把被虐。然后我就去看攻略,去练操作,去研究套路,这才是刻意练习。慢慢地,我对局势的理解和判断就快了,这大概就是所谓的“直觉”吧……但这直觉是建立在吐血练习之后的,纯靠直觉的,那叫“凭运气蒙对”。所以,直觉不是魔法,它是你肝了无数小时之后系统给你发的“新手光环”,告诉你“你有点感觉了,继续肝!”

说到现实中的帕隆多悖论,我脑洞一下哈!这不就像我们减肥一样吗?单独看,节食(游戏A)确实能瘦,但容易反弹,还特痛苦,长期下去效果不好。运动(游戏B)也很累,不是人人都能坚持,而且可能短期效果不明显,甚至还会因为肌肉增加体重不降反升,有点“输”的感觉。但如果把节食和运动结合起来(游戏C),不是极端节食,而是健康饮食加上规律运动,虽然单个看都感觉“难搞”,但组合起来,身体健康了,代谢提高了,体重反而稳定下降,这不就是两个“难搞”的事情结合起来反而效果爆炸吗?哈哈,这悖论简直是减肥福音啊!

这个问题可太发散了!如果不是本金倍数,那在真实世界里,能引发“输输得赢”的“状态”,我觉得可以是“时间的流逝”或者“环境的变化”。就像是你在股市,可能A策略在牛市里亏钱(因为太保守),B策略在熊市里也亏钱(因为太激进)。但如果你能根据市场是牛市还是熊市来切换策略(这个“市场状态”就是关键),该保守的时候保守,该激进的时候激进,即便单独拿出来看每个策略都是不完美的,组合起来在动态市场中反而能赚到钱。又或者是“资源稀缺性”的变化,比如在食物充足的时候(状态1),某种捕食策略效率低;在食物稀缺的时候(状态2),另一种捕食策略反而高效。只要能根据“状态”切换,就能实现整体优势!

针对“直觉是否一无是处”这个问题,从认知科学的角度来看,直觉并非简单的胡乱猜测,而是一种基于我们过往经验和知识储备,在大脑中快速进行模式识别和潜在关联的能力。它往往发生在潜意识层面,是我们进行刻意练习和积累大量知识之后,大脑形成了高效的反应机制。所以,直觉不是替代刻意练习的捷径,而是刻意练习达到一定高度后的副产品。优秀的数学家可能在“灵光一闪”后迅速把握问题核心,但这“灵光”是他们数十年苦思冥想和大量阅读思考的结晶。它可以指引方向、提供假说,但最终的验证和严谨的推理,还是得靠刻意练习得来的逻辑能力去完成。

针对“除了本金倍数,还有哪些状态变化导致帕隆多悖论”这个问题,在真实世界中,这种状态依赖可以是任何能改变系统微观行为的宏观条件。例如,在宏观经济层面,一项单独看可能导致失业率上升的自动化技术(游戏A),和另一项可能导致短期通胀的货币宽松政策(游戏B)。单独实施时都可能带来负面影响。但是,如果在经济衰退且劳动力结构发生变化的大背景下(这个“背景”就是状态),将自动化技术与职业培训计划(类似于切换到游戏B,但培训的侧重是改变劳动力状态)相结合,同时辅以针对性强的货币政策。那么,长期来看,自动化可能提升生产力,培训能让工人适应新岗位,货币政策提供流动性,整体经济反而能实现结构性优化和增长。这里的“状态”可能就是失业率、产业结构、公众预期等复杂变量的组合。

我很喜欢这个问题!针对“帕隆多悖论在现实生活中的应用”,我认为最典型的莫过于“投资组合多样化”了。单独来看,某支股票可能风险高、波动大,甚至短期内亏损概率也高(比如新兴市场股票);而另一种资产,比如债券,收益可能不高,甚至可能在特定市场环境下表现不佳。但是,当把这些看似单独表现不佳或风险不对称的资产组合起来时,由于它们对市场变动的响应方式不同(即所谓的“非线性互动”),一个亏损时另一个可能上涨,或者一个风险较高时另一个能起到对冲作用,最终整个投资组合的风险被分散,整体收益反而变得更稳定和可观。这不就是帕隆多悖论的现实映射吗?通过动态地调整资产配置,避免单一风险,实现整体优势。

帕隆多悖论的应用?哎呀,这不就是咱们平时说的“东方不亮西方亮”嘛!比如,一个公司有主营业务A,利润率低,市场竞争还激烈,单独发展可能就慢慢凉了。同时它还开了个副业B,看起来投入大,前期完全不赚钱,甚至还亏钱。但如果这两个业务不是独立发展,而是互相导流、互相支撑呢?比如,副业B虽然亏钱,但能给主业A带来大量用户或者技术沉淀。反过来,主业A的稳定现金流又能支撑副业B继续烧钱。结果可能就是,单独看A和B都跑不远,但组合起来,资源共享、风险平摊,最后公司整体盈利能力反而UPUP!这简直就是现实版的“输输得赢”啊!

要我说,直觉这东西在考试里确实没啥用,因为题目就那么摆着,你得一步步算出来。但如果你是去创新、去解决那种没人知道答案的问题,直觉就像是你在黑暗里摸索的时候,突然感觉到前面貌似有堵墙或者有个坑。它给你个大概的方向,省得你瞎转悠。但要真想通过那堵墙或者绕开那个坑,你还是得靠刻苦练习出来的“力气”和“技巧”去挖、去绕。直觉是起点,刻意练习是通关密钥,两者缺一不可吧!

哎呀,这问题太有意思了!除了本金倍数,我瞎想一下,在人际关系里是不是也有类似的“状态依赖”呢?比如,你跟A朋友聊天,你总是吐槽负能量(状态A,容易把人聊烦)。你跟B朋友聊天,你总是炫耀自己(状态B,也容易把人聊烦)。单独跟他们聊,他们可能都觉得你“有毒”。但如果你跟A聊完,心情变差了,下次遇到B朋友时,因为心情不好,反而变得谦虚低调很多(状态切换);或者跟B聊完,自我感觉良好,下次遇到A朋友时,就能更积极地开导A(状态又切换)。通过这种情绪和态度的“状态切换”,反而让两个朋友都觉得你变得“不错”了,人缘反而变好了!这简直是社恐福音啊,学会情绪管理,就能发动帕隆多悖论魔法!