位置: 首页 > 财经 > 正文

j.2% 概率——天道无常,天道恒常 v1.0

来源:哔哩哔哩   发表于: 2023-04-25 07:12:42  

这一篇简要谈谈概率,这个我们看不见,且经常忽视,但却无时无刻不影响我们的存在。

内容都是简单的科普,面向那些几乎没有理科知识储备的人群,大佬可以帮忙检查下我所说的有无需要更正的地方。

所谓简单的科普,就是将理科的知识,简化为小学-初中水平、或者文科生也可以看得懂的(有初等数学水平就应该能懂,甚至不需要),但如果从中拓展开来,可以一直延伸到高等数学或更专业的领域,不代表这个知识点仅仅如此。


(资料图片仅供参考)

就像爱因斯坦向普通民众解释相对论:“当你和最喜欢的人一起坐在火炉边,一小时过去了,你却觉得只有5分钟。但如果只有你一个人坐在热气腾腾的火炉边,你会非常煎熬,觉得度日如年,5分钟仿佛像一小时那么漫长。”这只是形象的比喻,让普通民众或其他领域的人也能稍微理解这些高深的理论,但事实上,想要研究相对论,至少得高中-大学物理的基础,当时的科学家都只有少部分人能理解。

所以这篇文章仅仅只是我以后所说内容的预备知识,只选取了数学大厦中的一个房间里的一件大家比较容易理解的摆设来说明。大概就像学生物的人会有物理化学这门课(简称物化),但他们不需要像物理或化学专业的学生那样精通,只需要学习跟本专业相关的知识点就行,也像编程的人,通常需要具备一定数学基础作为预备知识,但不是所有数学分支下的内容都是必须的。

其实所有门类的东西,研究到极致都会与其他学科产生关联,如果没有达芬奇,谁能想到一幅画作可以包含解剖学、物理学,乃至数学几何等知识。即使命理术数和其他玄学,有时也是能和数学物理等学科联系在一起的。

数学是很美、很深奥的,我的水平比较业余,也只能伪科普一下,不足以道万一。

▍正态分布

顾名思义,即正常状态下的概率分布,所以也称常态分布,从英文名Normal Distribution也可看出。相关理论还有大数定理、中心极限定理等等,感兴趣可以自行搜索了解。

正态分布是自然科学与行为科学中的定量现象的一个方便模型。各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从正态分布。尽管这些现象的根本原因经常是未知的。——维基百科

是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。——百度百科

就像下方视频中的高尔顿板,钉子平均分布,每颗小球落在钉子左右的概率都是1/2,我们无从预知每颗小球最终会落在哪,(即某一事件的结果在单次实验中会存在偶然或不确定性)。但在重复大量相同实验后,统计产生的结果,会存在明显的规律性——某一随机事件发生的频率(或某一区间内发生该事件的频率),会无限趋近于一个常数,这个常数即是该事件发生的概率

例如这些小球散落在各个区间的概率,就符合正态分布。

以下这一小部分数学上的定义可以省略,因为觉得图像好看所以就从wiki搬过来了。

若随机变量Χ服从一个位置参数为μ、尺度参数为σ的正太分布,记为:

X~Ν(μ, σ²)

则其概率密度函数为

当μ与σ的取值不同时,其图形也不同。日常中较多应用的是标准正态分布,即μ=0,σ²=1时的红色曲线。

随处可见的正态分布

就像自然界有许多与数学紧密关联的现象(花菜或宝塔菜上的菜花呈斐波那契螺旋线、雪花与许多植物(包括前面的花菜)的分形几何),正态分布也是其中之一。我们也是自然界的产物,同样受到许多规律支配。例如身高,假如以高度为横坐标,人数为纵坐标,那随着样本数的增大,绘制出的直方图会越来越接近正态分布曲线(同年龄段同性别)。

刚好这两天(写的时候的确是那两天,但发布文章隔了半个月……)刷到一个视频,关于身高部分也有提及正态分布,这基本是共识了。

手头没有大量真实数据,所以用代码模拟数据并作图方便理解。(在此感谢chatgpt帮我搓的代码,自己好久没搓了)

样本数越多,它们的分布就会与红色曲线越吻合。同样地,体重、智商,乃至考试分数等等,也会近似地服从正态分布。

▍幂律

幂律是两个量之间的函数关系,其中一个量的相对变化会导致另一个量的相应幂次比例的变化,且与初值无关。各种各样的物理、生物和人造现象的分布在很大范围内大致遵循着幂律。¹

下面这个图表是2022年我国gdp城市排名前100的散点图,然后通过拟合得到各个函数。

其中R²是拟合系数,表示回归分析中,预测数据与真实数据的拟合程度。反映了回归模型(方程)对样本(因变量y)的解释程度,模型的精确度。它不是某个数值的平方,取值可以为负,范围-∞<R²≤1,越接近1,代表该模型的预测值与真实值越接近,数据拟合程度越高。²

橙色是线性拟合,R²=0.5727,拟合性很差。

绿色是对数拟合,R²=0.9312,关联性非常高了。

红色是幂律拟合,R²是所有拟合中(其余拟合我没有画出来,线多了画面很乱)最接近1的。你们也可以去找前100的数据,用excel作图,会得到跟我一样的图,不需要1分钟(就是手动输入数据可能要几分钟)。

同样地,很多领域的现象或规律,也呈现出幂律分布。

例如恒星初始质量函数(IMF)、遗忘曲线、帕累托法则(八二法则或80-20法则、二八定律)、长尾效应、泰勒幂法则(Taylor's power law)等等。¹

▍概率与规律

自然界乃至人类文明的社会产物或现象(其实人类也是自然界的产物),许多看似随机的事件,在经过足够多的次数后,就会存在明显的规律性。

你无法预知单次结果如何,但宇宙却又会告诉你看起来没什么用的最终答案。就像你无法知道每次抛硬币是正是反,或者骰子出现哪一面,但经过足够多的次数后,正反的比例约等于1:1,骰子每个面出现的概率无限逼近1/6——这不是废话吗?有的人估计会这么说。但就是这些很简单,简单到普通人都会觉得傻的问题或现象,衍生出了无数深奥的学科。从苹果到万有引力,从抛硬币到概率论、统计学、博弈论……

或许正像开头摘自维基百科中的描述——“这些现象的根本原因经常是未知的”。这就是宇宙告诉我们的秘密,说了些什么,又好像什么也没说。

▍以下内容纯属猜测

如同少数人创造了大部分的财富,少数人推动科技的前进,大部分时候,我们都是正态分布的中间部分,幂律分布的长尾部分,这应该是大概率事件。

同样地,我相信如果宇宙中有其他文明(对我来说没有如果,我相信一定有),那大部分文明也是处于同一个层级,只有极少部分文明,处于两端——刚诞生,或者已经接近宇宙真相。但即使同一个层级或水平,对彼此来说也是鸿沟,因为同一个层级是对宇宙来说的,几百几千万年之内意味着同一层级或区间,但对我们来说,几百年的差距就足以让一个文明对另一个文明形成毁灭性打击了——幸亏宇宙中的距离都是以光年为起步,彼此之间至少隔着几百几千万光年,再弱小的文明,也可以偏安一隅,有一段独自发展的时期。

当然,这只是个人猜测,没人能证明。

▍电子云(有点关联的题外话)

这部分是题外话,但觉得又有点关联,所以也写进来。

下图是氢原子的电子云模型。核外电子出现在空间上的概率密度(不同于概率)。对于这个电子,我们只能说在某个位置找到它的可能性很大。理论上来说,这个电子可以出现在地球上的任一点,乃至太阳系、宇宙中,只不过在那些地方,我们能寻找到它的可能性非常小(接近0但不为0,物理就是这么严谨)。³实际上,超过某个区域,它出现的概率就接近0,这个区域,通常就是我们认为的原子半径——理论上来说,原子可以无限大,因为它的电子有极其渺茫的可能、在无限远的地方被找到(似乎有种天地与我并生,而万物与我为一的感觉)。所以实际上我也只能模拟出它的部分概率密度分布,因为原子核相对于原子非常非常小,半径(r)只有几千或几万分之一,体积(4πr³/3)则是几千亿或几万亿分之一。

此外这张图像中,密密麻麻几千个点,但实际上自始至终,活动的也只有1个电子,是我们通过“拍照”,拍下了这个电子位置的概率密度分布。

在我们没有观测它之前,它是图像上每一个点,每一个点都是它,就像薛定谔的猫,既死又活,这个电子既在A₁处,也在A₂、A₃……Aₙ处,宏观世界的猫要么死要么活,电子位置要么在这要么在那,但在微观世界,“猫”就是既死又活,电子就是既在这又在那的,这就是微观世界的设定之一——叠加态。一旦我们进行观测,猫才坍缩成了宏观世界的要么死要么活的其中一个状态,电子也坍缩为了图中的某一个概率点。生活在宏观世界的你也许无法理解,但你只要记住,微观世界就是有这种设定。这也是为什么量子计算机在解决某些特定问题上,能表现出超过超级计算机几万亿倍的效率,运用的就是量子神奇的叠加态属性。

▍结语

这篇文章的主要目的,是想通过揭示或联系某些生活、自然、社会现象的背后,隐藏着的数学规律,来引起人们一些思考。其实我们不仅被物理支配着,也同样被数学支配着。

我们可以不懂生物、物理与数学,但这不妨碍我们身上发生着各种化学反应、生理变化,不妨碍万有引力影响我们,以及活在各种各样的概率事件中。

概率,即意外着没有绝对,就像每一次随机事件是变数,但最终所有随机事件的结果又呈现定数,它们之间的关系,非常的微妙。难以形容,难分彼此,如同阴阳一般,你中有我,我中有你。

我敢说,没有科学家所有的言论都是对的,即使是爱因斯坦也有出错的时候(比如量子纠缠)。同样地,玄学领域的占卜也是,即使是一位铁口直断的神算,他的一生中,也必定会有失算的时候。

然而我总是见到一些科学工作者,或者玄学命理师,对自己似乎有100%的自信,确信自己每一个言论或卦象,都是对的。按照我对以上规律的总结,无论多么厉害的人,我也只会认为他一生中仅能做到绝大部分正确,而非完全。

“在尽可能多地了解自然界的努力中,现代物理学曾发现,有些事情永远不可能确切地'知道'。我们的许多知识,必然总是不确定的。而用几率来表达时,我们所能获得的知识则最多。”——《费曼物理学讲义》

科学总是在证伪中进步的,所以科学工作者应该为那些不同的声音感到兴奋。

可道之道非常道,所以命理师们也应该珍视那些测不准的人或事。

凡事留一些余地。

卦不敢算尽。

天道无常,天道恒常。

附:

1.参考维基百科Power law

2.美国质量协会认为R²不适用于非线性拟合,不过很多数据分析中还是会使用

3.《费曼物理学讲义》

关键词:

上一条:《真相》只是北京科学技术出版社2018年出版的一本书

下一条:最后一页