首页   

面对不确定性时,你在运用哪种思维模式思考?

中科院物理所  · 物理  · 昨天

正文


我们生活在一个充满不确定性的世界:明天会下雨吗?股票会涨还是跌?一场手术的成功率有多大?


概率正是我们用来描述不确定性的关键工具。


可问题是:概率究竟是什么?是一枚硬币在无限次抛掷中正面朝上的频率?还是我们对“硬币下一次会正面朝上”的信念?


是世界的固有本质,还是仅仅反映了我们的主观信念?


事实上,针对概率的解释,一直存在着两种主流思维方式 ——频率派(Frequentist) 和 贝叶斯派(Bayesian),这两个学派之间有着跨越了两个半世纪的争论。


两种概率哲学:

贝叶斯主义 vs 频率主义


频率主义认为概率是客观存在的,是长期重复实验中事件发生的比例;贝叶斯主义则认为概率是主观信念的反映,根据新证据不断调整更新。这种对概率本质理解的差异,也会体现在两者在生活中的思维和决策方式。


比如在外出旅游时,频率主义者更倾向于通过已有数据做决策。他们会花时间搜集热门景点的攻略,把评分最高、评价最多的地方列为首选。在他们看来,这些景点经过大量游客的“实验验证”,是更安全可靠的选择。那些评价较少或鲜有人提及的小众景点,缺乏数据支持不值得冒险。贝叶斯主义者则更倾向以主观感受为起点。他们会根据当前认知(比如对目的地的文化、历史背景的兴趣等)先挑选首站地点,随后通过实际体验更新认知。他们更注重动态体验的过程,而非决策的确定性;


又比如决定约会心动对象前,频率主义者会更倾向用数据验证感受,像是通过查看对方的社交媒体动态、朋友评价等评估对方是否靠谱,而贝叶斯主义者则更相信自己的直觉,即使对方背景信息模糊,也愿意先基于初步好感展开尝试,然后通过互动逐步调整对对方的认知。


可以发现,在决策上,频率主义者更像一个崇尚安全感的保守派,冷静和严谨,强调利用大量数据提炼客观规律以降低风险。然而,他们对不确定性保持极度克制,面对新情景时缺乏灵活性;贝叶斯主义者则更像一位崇尚直觉的探索者,凭借先验知识和新证据构建动态认知,乐于尝试不确定性较高的选择。他们信念灵活,行动果断,但也偶尔可能因过度依赖主观判断而显得不够客观。


生活中的这两种思维方式,恰恰体现了统计学中频率主义与贝叶斯主义在概率理解上的差异:频率主义注重客观规律的提炼,而贝叶斯主义强调主观认知的调整与更新。这种差异不仅塑造了两种决策风格,也构成了它们在统计推断中的核心哲学。


两个学派的核心区别在于对概率本质的理解。


频率统计 vs 贝叶斯统计原理



频率统计:通过重复试验逼近真相

“概率是客观存在的规律”

频率主义认为概率的本质是事件在长期重复实验中表现出的客观规律,而不是主观信念。试验次数越多,观察到的频率越稳定,越接近真实概率。比如扔硬币,最初几次正反面的比例可能波动很大,但当重复扔上几千次、几万次,正反面出现的比例会趋于一个稳定值,接近1/2,也就是大数定律所说的:重复足够多次,随机波动会被抹平,规律自然显现。

▲ 图 / 使用Midjourney生成

频率主义如何从数据中得出结论?

在频率统计中,参数就是每个事件背后的「固定特征值」。参假设你在掷硬币,正面朝上的概率就是你关心的参数。频率派认为这个参数是一个确定的值,它可能是 0.5也可能是 0.6,但总之是客观存在的。就像造物主已经把这个参数写好了,是像物理常量一样的客观存在,我们的任务就是通过大量实验去逼近这个真实的参数。

核心决策工具

频率主义通过假设检验来做决策。比如,科学实验常用的“p 值”就是频率主义用来衡量假设与数据之间冲突程度的工具。


假如你怀疑一枚硬币是正反不公平的作弊硬币,你会先假设它是公正的(正面概率是 0.5),然后根据p值来选择推翻或接受这个假设。如果 p 值很小(通常小于 0.05),说明数据与假设矛盾,我们可能会拒绝原假设。

推断的核心工具是最大似然估计(MLE)MLE的基本逻辑是:假设参数是固定的未知量,我们通过计算在这些参数下观测到当前数据的可能性(似然)来判断哪个参数值最合理。简单来说,MLE 就是找到那个最可能生成你观测到的数据的参数值,用来解释「为什么你会观察到这些数据」,用数据倒推出最合理的解释。

最大似然估计提供了一个最佳点估计值,但单次试验的结果通常具有不确定性。因此,频率统计还通过置信区间(CI)来描述这种不确定性。比如一个 95% 的置信区间,意味着在无限次重复实验中计算出的置信区间中,有 95% 的置信区间会包含真实的参数值。

频率主义推断的整个哲学是「真实的参数已经存在,数据虽有噪声,但足够多的数据能够逼近这个真实值」。

换句话说,频率是对真实概率的一种渐进估计,但它永远需要大量重复试验的支持。因此频率统计特别适合像抛硬币掷骰子、工厂生产等这种可重复,条件稳定的事件,但对于不能重复的事件(比如明天的天气这样的单次事件)或复杂环境(比如金融市场),频率统计就显得力不从心。


贝叶斯主义:先有信念,再用数据动态更新信念


“概率是主观信念的度量”


贝叶斯统计的核心思想是,概率并不一定是客观存在的规律,而是对某件事情发生可能性的主观度量。


比如,当你早晨看天气预报,得知今天下雨的概率是30%。这就是你的初始信念,也就是先验概率。到了中午,你抬头发现乌云密布,风也变大了。这些新的线索显著增加了下雨的可能性,你重新评估认为下雨概率提高到了70%。这个过程就是典型的贝叶斯更新:从已有知识(30%)出发,通过观察新数据(乌云和大风),重新评估世界的可能状态。


贝叶斯主义的核心工具是贝叶斯定理


贝叶斯定理描述了一种更新信念的过程,用动态调整抵消先验的局限。


公式中:

P(A|B) :后验概率 —— 也就是我们最终更新后的信念

P(B|A) :在A假设成立下观察到数据B的概率 

P(A) :先验概率(初始信念, 是我们在没有新证据之前我们对参数的初始信念。它来源于已有知识、经验或猜测,可能带有偏见,但并不要求准确无误)

P(B) :边际概率(数据的总体可能性)


贝叶斯公式就像一种怀疑精神的完美体现:承认我们对真实参数一开始可能一无所知,或者只有一些模糊的判断(先验信念),然后将已有的信念(先验分布)与新线索结合,生成一个更准确的新信念(后验分布)。贝叶斯定理的后验更新机制提醒我们,我们的决策仅是我们当下认知的产物,而不是最终的真相。


两种方法的适用场景与实际应用


频率统计的思路非常严谨,特别适合处理稳定、大规模数据的环境


比如工厂生产需要严格监控产品质量,频率统计在这里可以确保生产结果的一致性:比如通过统计过程控制图监控产品的关键指标,利用假设检验(如t检验)评估生产过程是否异常等;汽车制造商定期抽样检测发动机零部件,确保尺寸偏差在设计规范;在医疗与公共卫生决策中,医疗领域频繁使用大规模临床试验和群体数据来制定治疗方案。医生的治疗决策和患者的服药选择,都间接依赖这种集体智慧。




而贝叶斯方法的优势在于它能结合先验知识和实时数据,动态调整判断,非常适合小样本和高度不确定的环境


比如在商业分析中,结合历史销售数据和实时市场反馈,贝叶斯模型能不断更新对新产品成功率的预测;天气预报中,贝叶斯模型将历史气象数据与实时观测整合在一起,使天气预报更加精准。例如,飓风轨迹预测会根据新一轮卫星数据不断调整模型的后验概率;视频网站的推荐系统中通过动态更新用户的行为数据,实时推荐最可能感兴趣的影片。贝叶斯方法也是动态控制和人工智能领域的重要工具,比如无人车综合历史传感器数据更新环境模型,动态预测车辆状态和道路情况。


但这两种方法也各有局限性。


比如,频率主义讲究样本足够多才能下结论,擅长那些可以一遍遍重复的事情。比如工厂里每天生产的几万件螺丝钉,但无法应对“只发生一次”的事,比如要预估一颗小行星撞地球会带来多大影响,它就犯难了——因为没有过去的“实验记录”。频率主义没办法回答具体概率问题,因为它只和零假设较劲,而不关心假设本身的真伪。另一个槽点就是p值的迷之阈值。p值是频率主义的标配工具,用来衡量实验结果和假设是否显著不同。问题在于它过分依赖人为设定的标准(比如p<0.05就算显著)。这也可能带来一些荒谬情况:p=0.049的实验就成功,p=0.051就不显著,得出完全相悖的实验结论,但这里面很可能只是随机波动。


贝叶斯方法可以说是频率主义的对立面,它能够很灵活地结合已有知识和新数据动态调整,及时调整后验给出决策,但也一样存在硬伤。其局限性主要在于主观偏见导致的错误放大效应


首先,贝叶斯的方法的起点是“先验”。也就是你要提前假设一个初步概率,这个先验可以基于主观经验,但如果一开始就猜错了,后续结论就可能一直跑偏。比如你主观认定某投资项目的成功率是90%(先验),但实际上它只有30%。即便后面有新数据纠正,结论可能依然偏乐观。更糟糕的是,贝叶斯更新过程中,错误的先验会被一步步强化,最后整个判断离真相越来越远。这就有点像下棋,每一步都要基于上一轮的结果。如果某一步棋下错了后面的局势可能全盘崩坏。同理,这也会加强信息茧房,比如推荐系统根据你的观看记录推荐电影,如果系统一开始认定你爱看喜剧片(哪怕只是你无意中看了几部),后续更新可能一直强化这个偏见,最后会一直给你主推喜剧,需要后续大量的「主动纠偏」行为来刷新系统对你的印象。


在实际应用中,两种方法各有优势和局限:频率统计适用于大样本和明确实验设计的场景,如临床试验、A/B 测试,强调客观和严谨,但缺乏灵活性。贝叶斯统计擅长处理小样本或结合历史经验的复杂问题,如疫情建模、罕见病研究,灵活但易受主观影响。


两种方法没有优劣,真正的智慧在于根据问题选择合适的工具:用频率统计把握规律,用贝叶斯统计应对不确定性。






哲学迷思:

概率、决定论与自由意志


频率主义的世界观中,概率是一种客观的、可以逼近的真理;贝叶斯主义则认为概率是我们对世界不确定性的主观表达。


那么,概率的本质是什么?它们描述的是一个决定的世界,还是一个随机的世界?统计学中关于概率的争论,实际上让我们触及了一个更宏大的哲学问题:


我们是真的能摆脱主观性,追求真正的“客观”吗?


想想即便是极度追求「客观」的频率主义,它的实验设计也依赖隐含的假设——比如世界是可重复和稳定的。这本身也是一种“隐性先验”。 无论是频率主义还是贝叶斯主义,统计学从未真正摆脱人类思维的主观性框架。我们的认知方式受限于经验和假设,可能永远无法触及“真实的本质”。

▲ 图 / 使用Midjourney生成

人生:书中角色还是书外读者?

掷骰子时,我们觉得结果是随机的,因为我们看不到背后的复杂因素。但实际上,骰子的重量、桌面的摩擦力、手腕的角度和力量——所有这些因素早已决定了骰子的轨迹。所谓的随机性,只是我们对这些变量无法完全掌握时,用概率描述的不完全认知。


想象你正在阅读一本书。你以为自己是翻阅书页的读者,可以选择章节,为角色的命运叹息。但事实可能更复杂:或许你更像书中的某个角色。你的每一句话、每一个选择,早已写在剧本里。而更有趣的是,这只看似能够自由翻书的手也可能是书中的一部分,包含在更宏大的剧本中。

那么,如果宇宙中的一切都有其规律和概率的解释,世界是否完全由因果链条所支配?而我们又是否真正拥有自由?

拉普拉斯的决定论提供了一种令人着迷的想象:如果有一个“全知全能”的智慧生物(即“拉普拉斯妖”),能够完全掌握宇宙中每一个粒子的初始位置和动量,以及自然法则的运行规律,那么它便可以预测未来的一切,甚至还原过去的每一个细节。在这种框架下,世界是完全确定的,没有任何偶然性,甚至你眼下的每一个选择,早在初始条件中便已注定。

这种观点让人震撼也不安。如果一切都是注定的,那我们所谓的自由意志是否不过是一种错觉?是否我们所有的决定都只是因果链条中的一个环节?假如你今天选择阅读这篇文章,这真的是你的主动选择,还是你的经历、基因和外部环境决定了这一切?


自由意志的可能性:决定与随机之间的平衡


贝叶斯主义的哲学意蕴为我们提供了另一种视角。它承认世界的不确定性,主张通过新数据不断更新信念。这种动态调整的方式也许无法完全摆脱“主观”,但它提醒我们:我们并非注定被完全束缚在因果锁链中,而是可以在不确定性中寻找突破的可能。


你今天的选择,究竟是自由意志的体现,还是因果关系的必然结果?


你所定义的“命运”,是随机性的结果,还是剧本里早已写好的结局?


我们追求的“客观”,是世界的真实,还是我们认知能力所构造的假象?


或许,真正的答案并不重要。在决定与随机之间,正是我们有限的自由,赋予了人生以意义。 我们的选择可能是规则与偶然之间的微妙平衡—— 一种有限的自由,却足以让我们为自己的命运负责。


我们可能永远无法触及世界的本质真相,但这并不妨碍我们为自己的选择赋予价值,为自己的故事书写意义。


▲ 图 / 使用Midjourney生成


参考资料:

[1] Laplace’s Demon. Wikipedia.

https://en.wikipedia.org/wiki/Laplace%27s_demon

[2] Bayesian Inference Explained. Towards Data Science.

https://towardsdatascience.com/bayesian-inference-explained-79a4f2dc5d2c

[3] Frequentist vs Bayesian Approaches to Statistics. Wikipedia.

https://en.wikipedia.org/wiki/Frequentist_inference

[4] Bayes’ Theorem. Khan Academy.

https://www.khanacademy.org/math/statistics-probability/probability-library

[5] Maximum Likelihood Estimation (MLE). Statology.

[6] The Philosophy of Probability: Bayesian vs Frequentist. Stanford Encyclopedia of Philosophy.https://plato.stanford.edu/entries/probability-interpret/

[7] The Role of P-Values in Frequentist Statistics. American Statistical Association.https://www.amstat.org/asa/files/p-values-guidelines

[8] Decision Theory and Bayesian Statistics. JSTOR.

https://www.jstor.org/stable/10.1086/677662


[10] Applications of Bayes’ Theorem in Machine Learning. Analytics Vidhya.

https://www.analyticsvidhya.com/blog/2016/06/bayesian-statistics-bayes-theorem/


源:DataCafe

原标题:不确定性的两种哲学:频率主义 vs 贝叶斯主义,你是哪种思维模式?


编辑:潇潇雨歇


转载内容仅代表作者观点

不代表中科院物理所立场

如需转载请联系原公众号



扫码进入“科学与中国”小程序,可观看以院士科普视频为代表的优秀科普视频,第一时间获取中国科学院公众科学日、科学节等科普活动报名信息。



近期热门文章Top10

↓ 点击标题即可查看 ↓

1.发呆时眼睛为什么可以自动失焦?| No.441

2.大米变难吃了,而且还会越来越难吃,科学家已经证明了这一点

3.煮水饺要点三次凉水?真的对吗?|正经玩

4.啥玩意儿啊敢啃潜艇,还敢给虎鲸“拔火罐”?

5.掺了棉花的冰块竟然砸不碎?丘吉尔也干了!
6.南方水边的“开会小人儿” 是啥?近几十年咋这么多?
7.地球的颜色正在改变,这不是件好事
8.为你的咖啡遮风挡雨的树,结的“冰淇淋”很好吃但天价……
9.4只蚂蚁+1杯牛奶=1杯酸奶?
10.发明油炸的人真是个天才,冰溜子和啤酒都能炸?
 点此查看以往全部热门文章 

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com