【文摘】无穷大的密码

数学与通识

无穷大的存在问题是一个令人惊讶的古老问题。亚里士多德首先引入了一个明确的区分,以帮助理解它的意义。他区别两种不同的无穷大。其中之一,他称之为潜在无穷大:这种无限大刻画了无止境的宇宙或一个永无休止的名单,例如自然数1、2、3、4、5,等等,永远继续下去。这些是没有结束的列举或没有边界的疆场,你永远无法到达数的终点,或乘太空飞船达到无休止的宇宙终端。

亚里士多德很乐意这些潜在的无穷大,他认识到,它们的存在在他关于宇宙的思维方式中没有制造任何大麻烦。亚里士多德将所谓的实际无穷大与潜在无穷大相区分。这些将是你可以测量的局部的东西,例如固体的密度、光的亮度或一个物体的温度,在某个特定地方或时间变成无限。你将能在宇宙中局部地遇到这种无限。亚里士多德禁止实际无穷大:他认为它们是不可能存在的。这与他的本质上不可能有完美的真空的信念是一致的。如果可能的话,他相信人们能够推动一个物体并加快到无穷的速度,因为它不会遇到阻力。

几千年来,亚里士多德的哲学构成西方和基督教教义关于宇宙本质的基础。人们继续认为,实际的无穷不可能存在,如果存在的话,那么唯一实际无穷是神性。

数学的无穷

但在19世纪接近尾声时,数学家乔治·康托尔发展了一种更微妙的方式定义数学的无穷,它使数学世界开始发生变化。康托尔认识到,有一个最小类型的无穷大:永无休止的自然数列1、2、3、4、5…。他称这是一个可数无穷大。任何其他的无穷大,如果可以通过把其成员以一对一的方式对应到所有自然数,也被称为可数无穷大。这个想法有一些有趣的后果。例如,所有的偶数全体也是一个可数无穷大。直觉上,你可能会认为偶数只有自然数的一半多,因为对有限个数的列举这是对的。但是,当列举变得无止境后,这不再为真。

你可以给出一个从1到2、从2到4、从3到6等等直到最后的两个列举之间的一一对应。每个偶数将对应到自然数列中的一个唯一的相关数,所以这两个数集有同样多的数。伽利略首先发现了这个事实(尽管他数的是平方数1、4、9、16,等等,而不是偶数),因为感到太奇怪了,导致他不再进一步思考任何无限集合。他认为,这件事有一些危险的自相矛盾之处。然而,对于康托尔而言,能够在数集和其子集之间建立一个一一对应的关系,是一个无限集合的标志性特征。同样,所有有理数的全体,也就是所有的分数,是可数无穷大。系统列举这些数的方法是把分数的分子和分母加起来,然后先写下所有分子分母和为2的分数(只有一个,1/1),然后所有加起来为3的分数(1/2和2/1),依此类推。每次你只计数有限多个的分数(p+q=n的分数p/q个数是n-1)。这是计数所有有理数的一个可靠配方:你不会错过任何数。这表明,有理数是可数的,即使在直观感觉上,分数似乎比自然数多得多。

康托尔接着证明,还有其它类型的无穷大,并在某种意义上比可数无穷大要大得多,因为它们不能以可数无穷的方式来计数。这样一个无穷大的特征由所有实数的全体体现。像实数一样,这些都不可能被计数,没有系统地列出它们的方案。这种不可数无穷大也被称为连续统。但是找到这个无限大的实数集并不是故事的结束。康托尔证明,你仍然可以找到越来越无限大的集合,一路向上直到永远,没有最大可能的无限集合。如果有人给你一个无穷集合A,您可以构建一个更大的集合,不与A一一对应,该集合就是A的所有可能的子集全体。这永无止境的无穷之塔通向一个称为绝对无穷大的东西—无穷塔最末的那个遥不可及的顶峰。在数学上,康托尔把无穷处理为实际的东西,而不是潜在的。你可以将它们相加,比如一个可数无穷大加上另一个可数无穷大结果也是可数无穷大。

关于是否应该允许这样做在数学上可以大做文章。有些数学家认为,如果允许康托尔的超限量(它们被如此称作)进入数学,你可能在一些地方引进某种类型的细微矛盾。如果你将矛盾引入一个逻辑系统,那么最终你将能证明什么都是真的,那则会带来整个数学系统的崩溃。这种担心导致有限主义或构造主义数学的诞生,它只允许数学对象通过有限次的逻辑论证步骤来构造。这样的数学就变成了有点像电脑那样做事,可以设置某些公理,仅仅通过有限步的逻辑步骤推导出的东西才被认为是真的。这意味着你不能把反证法(或排中律)作为证明的公理,反证法先假如结果不成立,然后推导出矛盾,这样原命题的结果必定成立。这个构造主义观点的19世纪支持者是荷兰数学家L.E.J.布劳威尔和德国数学家L. 克罗内克,外尔在20世纪对此也感兴趣了一段时间。有一些数学家们由于哲学和其他原因以这种方式定义数学,还有一些只是感兴趣于在这个限制的情形下到底可以证明些什么。但一般而言,康托尔的想法已被接受,今天它们形成纯数学的一个分支。这导致一些哲学家,甚至一些神学家,重新考虑他们关于无穷的古老态度。因为有许多种类的无穷大,很清楚你不必把数学无穷的出现看成是对中世纪的神学家认为的神性的某种挑战。康托尔的想法实际上最先受到当代神学家的热情追捧,而不是数学家。科学家们也开始区分数学的无穷和物理的无穷。在数学上,如果你说某物“存在”,你的意思是,对于给定的一组特定规则,它并没有引入逻辑上的矛盾。不过,这并不意味着它可以坐在你的办公桌上,或在某个实处运行。独角兽不是逻辑上不可能的,但是,这并不意味着从生物的意义上它存在。当数学家证明了非欧几何存在时,他们只是发现了存在一个公理系统,允许他们不会走向自相矛盾。

物理的无穷

所以,现代物理学中的无穷大已成为与数学上的无穷大互相独立。物理中无穷大有常见的一个领域是空气动力学或流体力学。例如,空气动力学中的波可能会变得非常陡峭及非线性,然后形成激波。在描述激波形成的方程中,一些量可能会变得无限大。但是,当这一切发生的时候,人们可能会认为它只是一个失败的模型。原因可能是忽略了摩擦或粘度,一旦把它们包含在方程中,速度梯度就会变成有限,尽管它可能仍然是非常陡峭的,但在现实中粘度确实可以小到几乎为0。在大多数的科学领域,如果看到一个无穷大,人们通常会想当然地认为是由于模型不准确或不完整所致。粒子物理中一直有一个更长时间未决及更微妙的问题。量子电动力学在整个科学中是最好的理论,关于宇宙它比我们知道的其他东西都有更准确的预测。然而,这些预测的获得也伴随了一个尴尬的问题:当做数值计算来验证实验观察的时候,人们似乎总是得到一个添加了额外有限位的无穷答案。如果减去无穷大,留下来的有限部分就是人们希望在实验室中看到的预测,并总是极其精确地匹配实验。除去无穷大的这个过程被称为重整化。许多著名的物理学家们发现它极不令人满意。他们认为这可能只是一个理论的可以改善的症状。

同样的道理可以解释为什么弦理论在20世纪80年代创造了巨大的兴奋,导致大量的物理学家可以开始研究这一理论。这是粒子物理学家第一次发现了一个有限的理论,这些无穷大在该理论中没有出现。粒子物理的基本出发点是取代传统的观念:最基本的实体(例如光子或电子)应该是点状物体,通过空间和时间移动,所以在时空中被描绘。相反,弦理论认为最基本的实体是线或小圈,它们在移动时描绘出管道。当你有两个点状的粒子通过空间互动,就好像两条线相互打击,在相遇处形成一个尖角。图片中的尖角是所描绘的无穷之源。但是,如果你有两个小圈撞在了一起,这有点像一对裤子中的两条腿;然后又有来自另外两个小圈的相互作用,这像将另一对裤子缝到第一对上。你得到的是一个平稳过渡。这也是为什么弦理论如此吸引人的原因,它是粒子物理的第一个有限理论。

宇宙的无穷

另一种类型的无穷出现在引力理论和宇宙学。爱因斯坦的广义相对论表明,膨胀的宇宙(如我们所观察到的)在有限的过去开始之时,其密度是无限的,这就是我们所说的宇宙大爆炸。爱因斯坦的理论还预测,如果一个人掉进一个黑洞(在我们的银河系和附近有很多黑洞),他将在里面遇到一个无穷大的密度。这些无穷大,如果它们确实存在,将是实际无穷大。

人们对这些无穷大的态度是不同的。来自粒子物理并对弦理论关于宇宙起源有兴趣的宇宙学家会倾向于认为,这些无穷大都不是真正的,它们只是我们的理论不完善的附产品。还有其他人,彭罗斯(Roger Penrose)是其中之一,他们认为宇宙起源的无穷大在物理结构中起着非常重要的作用。但是,即使这些无穷大不是真正的无穷大,但密度仍然令人惊奇的高:比水的密度大10的96次方倍。在实际应用中,如此高的密度,以至于我们需要一个量子理论来描述空间、时间和引力特征的影响,了解在那里发生的事情。

如果认为我们的宇宙最终会停止膨胀并收缩到另一个无穷大,很奇怪的事情也许会发生,这就是一个大紧缩。大紧缩可能是不同步的,因为宇宙有星系,其密度比其他地方大。高密度区域在低密度地区前进入未来的无限大。如果我们处于宇宙中某个小地方,它大大推迟未来无穷大的到来,或甚至不会到来,那么我们可以回头看发生在其他地方的宇宙终止,这样我们就会看到一些无限。你也许会看到空间和时间即将在某个地方结束的证据。但是你很难精确预测当实际无穷大在某处出现时你将看到什么。在我们的宇宙于瞬间形成的过程中,有一个令人纳闷的防御机制。对这些的一个简单解释是:在每个黑洞的中心有无穷大的密度出现,恰似宇宙终端的无穷大。但是黑洞围绕这个现象产生一个景象:甚至光也不能在它附近逃逸。因此我们孤立了,看不到在那些其密度看上去好像要趋向无穷大的地方究竟发生了什么。反过来,无穷大也不能影响我们。这些景象使我们免于那些密度无穷大的地方产生的后果,它们也阻止我们看到发生的现象,除非我们位于黑洞之内。

另一个问题是我们的宇宙在空间上是有限还是无限。我认为我们永远不知道。它或许是有穷大的,但其尺寸任意大。但对许多人而言,有限大宇宙的想法立刻带来宇宙之外是什么的问题。没有“之外”—宇宙就是存在之万物之集。要理解这点,让我们想想二维宇宙,因为它们更容易想象。如果捡一张A4尺寸的纸,我们知道它有边缘,故有限的宇宙怎么会没有边缘呢?但关键之处是这张纸是平整的。如果我们想想二维的弯曲表面,像球的表面那样,则球面的面积是有限的:你仅仅需要有限量的颜料将它上色。但如果你在它上面走动,与在纸上走不一样,你永远到不了边缘。因此,弯曲的空间可以是有限的,但没有边界或边缘。要理解一个膨胀的二维宇宙,让我们首先想想一个无穷情形,其中平均而言无论走向何处,宇宙看上去都是一样的。那么无论你站在何处并向周围张望,看上去宇宙以你为中心向外膨胀,因为每一处都像是中心。对于有限的球面宇宙,把它想象成一只气球,并在表面上标上了星系。当你开始对气球充气时,星系开始彼此相向而退。无论你站在气球表面何处,你可看到当橡皮膨胀时,其他星系离你膨胀而去。膨胀中心不在曲面上,它处于另一维,在这个情形是第三维。因此我们的三维宇宙,假如它是有限的并正向弯曲,则其行为好像是一个想象的四维球体的三维表面。

爱因斯坦告诉我们,空间的几何由它当中的物质的密度确定。这颇有点像橡胶蹦床:如果你把物质放在蹦床上,这使得曲率改变。如果空间有大量的物质,它会导致一个巨大的角距降低,使得空间合拢。因此,一个高密度的宇宙需要一个球形的几何形状和一个有限的体积。但是,如果你有相对较少的物质变形空间,你则得到一个负曲率的空间,形状像一个马鞍或炸薯片。这样的负曲率空间可以继续被拉伸和膨胀下去。一个低密度宇宙,如果它有一个简单的几何形状,将有无限的尺寸和体积。但是,如果它有一个更奇特的拓扑结构,像一个圆环面这样的,也可以有一个有限的体积。关于爱因斯坦的方程的奥秘之一是,它们会告诉你如何从物质分布推导出几何形状,但他的方程关于宇宙的拓扑结构却没说什么。也许更深入的量子引力理论可以对此说些什么。

【数学】三进制的妙用
【数学】扑克中的捉乌龟游戏
【人物】欧拉,数学家中的神学家:对上帝的信心,陪我走过苦难的日子
【数学】四元数
【书籍】返璞归真–C.S.路易斯
【人物】华罗庚与中国计算数学
【数学】关于幂数小数分布的问题
【文摘】红楼梦时间表
【数学】猫捉老鼠趣题系列(四)
【人物】塞德里克•维拉尼

发表在 数学, 格物 | 标签为 , | 留下评论

【人物】天才数学家伽罗华

数学与通识

他是一个天才少年,15岁学习数学,短短5年就创造出对后世影响深远的“群论”,带来数学的革命。他也是一个悲情少年,两次升学未成,三次论文发表被拒,两次被捕入狱,20岁时就因与情敌对决而黯然离世。他就是法国数学家伽罗华,其惊人才华的背后却是充满坎坷的悲剧人生。2021年是伽罗华诞辰210周年,当我们再次追忆这段科学史上的传奇时,依然会为其成就赞叹,为其命运唏嘘。

令人惊叹的天才少年

伽罗华1811年出生于法国巴黎,1826年,15岁的伽罗华开始选修初级数学的课程,从而使他的数学天赋被彻底激发。伽罗华很快对数学教科书的内容感到无聊和厌倦,开始自学数学大师的巨著,如勒让德的《几何原理》、拉格朗日的《解析函数》等。伽罗华有着炉火纯青的心算本领,可以凭借纯粹的心算完成最困难复杂的数学研究。

1828年伽罗华在法国一个专业数学杂志上,发表了他的第一篇论文——《周期连分数一个定理的证明》。虽然此时的伽罗华还只是一个中学生,但已经能把大数学家的工作向着更完美的方向推进。也正是这一年,17岁的伽罗华第一次参加升入巴黎综合理工学院的竞赛考试,这所学校被誉为法国科学界的最高学府。但可能因为准备不足,伽罗华的考试失败了。这次考试的失败让那些惊叹于他数学天赋的伙伴们感到吃惊。许多人认为这次失败是一种不公正行为的结果,直至20多年后,这种争论仍未停息。

厄运不断的学术生涯

早在1828年,17岁的伽罗华就开始研究方程论,他创造了“置换群”的概念和方法,解决了几百年来使人头痛的高次方程求解问题。伽罗华最重要的成就,就是提出了“群”的概念,他用群论改变了整个数学的面貌。1829年5月,伽罗华将其研究的初步结果提交给法国科学院。负责审查这篇论文的是当时法国数学界的泰斗——柯西。当时柯西意识到这篇论文的重要性,也曾提及要在科学院的会议上介绍这篇文章,但在随后的科学院会议上柯西并未提及伽罗华的工作。为何柯西会忘记这么重要的事,成了一个无法解开的谜。后来,伽罗华论文的手稿也遗失了,此事便不了了之。

1829年7月,伽罗华的父亲在政治斗争中遭到迫害,自杀身亡。父亲的惨死对伽罗华打击很大。父亲去世后没过多久,18岁的伽罗华再次参加了巴黎综合理工学院的入学考试。在口试中,傲慢的主考与伽罗华辩论一道数学难题,主考自己错了却未意识到,而且对伽罗华自创的理论丝毫不能理解。在主考官眼中,伽罗华只是一个不切实际、好高骛远的学生,还轻蔑地嘲笑他。伽罗华感到相当愤怒,最后他居然把黑板擦扔到主考官头上。结果可想而知,伽罗华再次落选了。

1829年10月,伽罗华写了几篇大文章,并希望用自己的全部著作来应征法国科学院的数学特别奖。于是伽罗华整理好自己的论文,再次提交到法国科学院。此次主持审查论文的也是当时数学界权威人士,法国科学院院士——傅立叶!然而很不幸,傅立叶在3个月后病逝,也许根本没来得及仔细看这篇论文。后来人们在傅立叶的遗物中也没有再见到伽罗华的数学论文。就这样,伽罗华的论文第二次被丢失了。

伽罗华没有灰心,继续研究自己在数学领域的新成果,第三次写成论文,于1831年第三次向法国科学院提交。主持这次审查的是科学院院士泊松。这一次论文总算没有丢失,但论文中用了“置换群”这个崭新的数学概念和方法,以致像泊松那样赫赫有名的数学家一下子也未能领会。泊松认为伽罗华的论文晦涩难懂,希望他能更加详尽地重写。于是,伽罗华第三次提交给科学院的论文以一条“不可理解”的评语而被否定了。

1831年5月,伽罗华在一次宴会上拿出小刀挥舞,被人误认为“企图暗杀国王”,因此被送进了监狱。一个月后伽罗华在律师的帮助下,最终被法院裁决无罪释放。但被释放后仅一个多月,伽罗华因身穿炮兵部队制服带领群众在街上游行示威,再次被捕,这次他被判入狱6个月。

数学界未来之星的陨落

伽罗华第二次出狱后不久,便爱上了一个风骚的舞女。为了这个女人,伽罗华卷入了一场涉及“爱情与荣誉”的决斗。伽罗华知道他的情敌枪法很好,自己恐怕难逃一死,于是在决斗前夜,即1832年5月29日晚上,通宵达旦地把其平生所研究的数学成果写成了一个极其潦草的大纲,并在遗书手稿的旁边注释中写道“我没有时间了!”

1832年5月30日清晨,伽罗华在决斗中被情敌打穿了肠子,次日上午10点在医院去世。临终前,他拒绝接受神父的祈祷,他对弟弟阿尔佛雷德说:“不要哭,阿尔佛雷德!我需要足够的勇气在20岁时死去!”至此,数学史上最年轻、最富有创造性的数学家永远凋零,卒年20岁零8个月。

短暂生命的非凡贡献

伽罗华的论文手稿在他去世14年后,也就是1846年,才由法国数学家刘维尔领悟到其中所迸发出的天才思想,刘维尔花了几个月的时间研究并解释了它的意义,并将这些论文发表在极有影响的《纯粹与应用数学杂志》上,科学界传遍了伽罗华的名字。

历史上人类很早就掌握了求解一次方程和二次方程的方法。关于三次方程,我国古人在7世纪找到了一般近似解法,而西方到16世纪初由意大利数学家找到解法。三次方程被解出来后,一般的四次方程很快就被解出。这就很自然地促使数学家们继续努力寻求五次及五次以上的高次方程的解法。遗憾的是3个世纪过去了,前赴后继的数学家没有取得任何成果,著名数学家拉格朗日称这一问题是在“挑战人类智慧的极限”。

此后的19世纪,与伽罗华同一时代的阿贝尔终于给出了高于四次的一般代数方程不存在代数解的证明。伽罗华在阿贝尔研究的基础上,进一步发展了他的思想,把高次方程求解的问题完全转化为置换群及其子群结构的分析,彻底解决了困扰数学家们300多年的根式求解代数方程的问题,并通过研究这一问题提出了“群论”这一崭新的数学概念。作为伽罗华理论的推论,也能得出五次以上一般代数方程根式不可解,以及用尺规“三等分角”和“立方倍积”不可能等结论。而后面两个问题,是困扰了数学家们2000多年的“世界三大几何难题”(指为用没有刻度的直尺和圆规三等分角、化圆为方、立方倍积)中的两个。群论的出现标志着抽象代数的开创和兴起,这是代数的革命。

事实上伽罗华的群论不仅在数学领域渗透到几何学、代数拓扑学、函数论、泛函分析及其他许多数学分支中,而且在物理、化学以及计算机领域中都有重大的应用。直到20世纪90年代,安德鲁·维尔斯在证明费马大定理的过程中,依然用到了伽罗华理论。现在,群论在结晶学、理论物理、量子化学、编码学、计算机科学及算子理论等领域都发挥着极其重要的作用。

【数学】 哪些有理数角能用尺规作出
【科学】上帝掷骰子吗——量子物理史话(三)
【文摘】范畴论
【编程】Python基本字符串操作
【文摘】虚数不虚的秘密
【数学】有趣的自然数拆分
【数学】关于幂数小数分布的问题
【数学】趣味扑克牌魔术游戏
【数学】四元数
【软件】超级圆周率π运算器

发表在 数学, 杂篇 | 标签为 , , | 留下评论

【文摘】哪些是重要的数学才能

柯尔莫戈洛夫  好玩的数学

学习和研究数学所需要的特殊才能常常被人们过分地夸大。由于数学的非常形式化和课堂上很糟的教学,导致了数学特别难学的印象。如果有好的指导或者跟着一本好书,一个普通的中等才能的人足以毫不费劲地掌握中等学校的数学,而且更可以进一步学习,比如说,微积分初步。

但是,一旦涉及到专门选择数学作为职业时,很自然地就要用到自己的数学才能,或者有时称作数学天赋。事实上,在在数学中,理解数学推理,解答数学问题,乃至于更深一步去发掘新的结果时,不同的人当然有不同的速度,不同的难易程度和不同的成就。在这一部门中,那些能最有成效地工作的人正在力求成为千百万青年当中的数学专业人员。

所以,学校的数学小组,数学竞赛以及其他宣扬数学知识和发扬独立数学工作兴趣活动的主要目的之一就是协助青年,使得他们的数学天赋得以发挥。对于个别青年,不应当过早地赋予其数学天才之称号,但可以以谈话的方式及时启发,以竞赛奖励来推动,使他们这些有才能的数学人才去选择数学,作为将来他们的工作,这是必要的。

数学才能究竟是什么呢?

首先,需要明确,数学上的成就很少是因为机械记忆大量事实和个别公式而获得,等等。在数学上,如同所有事情一样,有很好的记忆力是很有用的,可是,大多数杰出的数学家并不见得具有特别突出的记忆力。用一个比较极端的例子来说明,如果有一个很偏才的人,记得住一系列很长的数字而且可以心算这种数字的加法或乘法,这种人并不会被看作是有好的数学才能。当然,此时的所谓数学才能是在严格意义下的数学才能。

有过代数学习经历的人知道,在代数计算中,例如,如果找到了较为复杂的文字式的巧妙变换,或者不用乘法而能找到更有效的方法去解方程等,都可以说接近了这种“才能”。对于从事严谨科学工作的数学家来说,这种才能是常常需要的。
通常也有一种情况,即就是上述那种计算才能的特别充分的发展,有时我们称之为“计算才能”,这是基本类型数学才能中的一种类型的特指。在中学代数中,进行代数式分解因式时,学生首先遇到的困难,就需要用这种才能来解决。在本文后附录中所列习题1 和2就属于这种情况!有时,一个很简单式子的因式分解则需要很多智慧。在解方程中,这种类型的才能更具其施展的园地。

然而,有时,在研究问题时,数学家会用几何直观方法。在中学教学中的实例,也可以充分说明几何直观方法的意义,例如,用图形去研究函数的性质非常有用。所以,在数学各分支以及在最抽象的问题研究工作中,几何直观起了很人的作用,这样说,不会使读者惊奇。

在中学里,通常很难给空间图形一个直觉的表示,应该用实例可以说明,按照通常中学的水准来衡量,这样的人才就是一个好数学家。即当他合上书之后,他不用画图就可以清晰地想象出,一个立方体表面跟经过它的中心而且垂直于它的一个对角线的平面的交线是什么样。

附录中习题4的所有解题难点就在于是否能直观了解切四面体所得到的交线是什么样的图形。几何直观在习题5-7的解决中也很重要。虽然,这类问题的解决还需要逻辑推理能力和理论的高深知识,并且后者对于证题来说是必备的。

数学才能的第三个重要方面是正确而又有条理的分段逻辑推理能力。在中学,首先,这种能力可以在具有定义定理和证明的系统化几何课程进行培养。然而,显然,对于中学生来说,从数学推理的逻辑结构来看,代数课程中的数学归纳法原理就是很难的学习内容。因为,对于很多学生而言,在这个命题本身的表述中,已经有很多的“每一个”“如果”“那么”等等的堆积。因此,正确了解和使用数学归纳法原理首先要有对逻辑的准确理解,还要有很好的判断力,这种对逻辑的成熟理解对数学家来说是很有必要的。

在不理解的情况下,很难得到有条理的逻辑推理能力。在进行中学数学竞赛解题中,就常常会出现这种意外的困难。在这里,并没有任何预先的中学数学课内知识基础的假定,但是,要求正确地理解题意和有条理的推理。

有一个滑稽问题,困扰了很多十年级学生。如果松林里有800000株树,并且其中每一株树上的松针不多于500000个,试证明,至少有两株树的松针数是相同的。

请与附录3 里习题8题进行比较。在习题10-12里,主要的困难不是所用的推理方法是否复杂,而是所要用的推理方法是不常见的。

数学才能的各方面都会在不同的组合里常常遇到,在这些不同方面里,如果单独一方面有突出的发展,那么就可以收到意外而非凡的结果。当然,这种单方面的发展终究是危险的。因此,用不着再用语言来说明,如果没有对自己事业的热爱,如果没有每天系统地勤恳工作,任何才能都是无效的。(姚芳译校)

附录 数学竞赛题选。

1.因式分解:x^5+x+1(列宁格勒,1951,8年级)。
2.因式分解:x^{10}+x^8+1(利沃夫,1946,9-10年级)。
3.求解联立方程xy(x+y)=30,x^3+y^3=35(列宁格勒,1951,9年级)。
4. 一正方体里有两个正四面体,第一个正四面体的顶点是正方体的四个顶点,第二个四面体的顶点是正方体其余的四个顶点。试求这两个四面体公共部分的体积与正方体体积之比,(伊凡诺夫,1951,9-10年级)。
5.在一球外外切一个空间四边形,求证:切点都在同一平面上。(莫斯科,1950,9-10年级)。
6.求证从正四面体里的任意一点到它的面上的距离之和是一常数。(斯大林格勒,1950.10年级)。
7.求证正面体的高的中点与到底的各个顶点之连线相互垂直。(喀山,1947,9-10年级》。
8.有五百只装着苹果的箱子,已知每个箱子最多可以装240个苹果。求证至少有三只箱子装了同样多的苹果。(基辅,1950,7-8年级)。
9.50!=1*2*3*...*50数内包含多少个0?(利沃夫,1950,7-8年级)。
10. 在24小时里,表的时针与分针有多少次相互垂直?(基辅,1949,7-8年级)。
11.n凸多边形最多有几个锐角?(基辅,1949,9-10年级)。
12.求证:13边凸多边形不能分割诸多平行四边形。(莫斯科,1947,7-8年级)。(姚芳译)

注释[1] 本文译自:柯尔莫戈洛夫. 论数学职业. 8-11页. (А.Колмогоров О профессии математика. 8-11.[2]此处谈到的是分解成为有理系数的多项式,开始时很多人会觉得在习题1和2里的这类的分解是不可能的。[3]在《论数学才能》中多处提到此附录中的习题,为了帮助理解,此处附上此附录。附录中有25道题,但《论数学才能》中涉及到的习题属于12(包括12)以前的题,因此,只列出前12道题。

选自《数学——科学和职业》,[俄]柯尔莫戈洛夫著,姚芳、刘岩瑜、吴帆编译,大连理工大学出版社

【科学】杨-米尔斯理论
【数学】科学大师的故事:数学奇才帕斯卡
【文摘】数学难题汇编(5)
【数学】奇妙的磨光变换
【文摘】数学奇才帕斯卡:我的上帝永远没有离开我
【数学】无穷的奥秘
【文摘】大学数学竞赛题汇编(10)
【文摘】大学生数学竞赛题汇编(5)
【数学】猫捉老鼠趣题系列(四)
【数学】彭罗斯镶嵌

发表在 数学 | 标签为 | 留下评论

【数学】泰勒级数的思想

数学与通识

高等数学干吗要研究级数问题?
是为了把简单的问题弄复杂来表明自己的高深? No,是为了把各种简单的问题/复杂的问题,他们的求解过程用一种通用的方法来表示。

提一个问题,99*99 等于多少? 相信我们不会傻到列式子去算,口算也太难了而是会做一个迂回的方法,99*(100-1),这样更好算。

那么 995*998 呢? 问题更复杂了,(1000-5)*(1000-2),式子比直接计算要复杂,但是口算却成为了可能。归纳一下,x*y 这样的乘法运算或者幂次运算,如何直接计算很麻烦的话,我们可以用因式分解的方法(中学生都能理解)来求解。但是因式分解仍然不够通用,因为我们总是需要通过观察”特定”的待求解式子,找到一种规律,然后才能因式分解,这是我们从小学到中学数学方法的全部: 特定问题特定的解答方法。那么,到了高等数学,怎么办? 研究一种方之四海皆准的,通用的方法。

泰勒级数的物理意义是什么? 就是把方程 g(x)=0 的解,写成曲线方程的形式看看和 x 轴有什么交点。例如 f(x)=x^2=5 等价于 g(x)=x^2-5=0和 x 轴的交点。而这个曲线交点可以用直线切线的逼近方法(牛顿迭代法)来实现,这就是泰勒级数的物理意义: 点+一次切线+2 次切线+…+N 次切线。每次切线公式的常数,就是泰勒级数第 N 项的常数。OK,从泰勒级数的式子可以看到,为了保证两边相等,且取 N 次导数以后仍然相等,常数系数需要除以 n!,因为 x^n 取导数会产生 n!的系数。泰勒级数,就是切线逼近法的非跌代的,展开式。泰勒公式怎么来的,其实根据牛顿逼近法就可以得到从 1 阶一直可以推导到 N 阶。

假设f_1(x)=f(x)-f(a) ,由牛顿逼近法有

f_1(x)=f'(a)(x-a)+o(x-a)^2

所以f(x)=f(a)+f'(a)(x-a)+o(x-a)^2

同理,假设f_2(x)=f(x)-f(a)-f'(x)(x-a)

两边求导,f_2'(x)=f'(x)-f'(x)-f''(x)(x-a)=-f''(a)(x-a)

再求不定积分f_2(x)=-(1/2)f''(a)(x-a)^2+C,C 就是那个高阶无穷小(需要证明)

所以f(x)=f(a)+f'(a)(x-a)+f''(a)(x-a)^2+o(x-a)^3

依次类推,最后就有了泰勒公式。

另一种证明过程干脆就是先写出来

g(x)=a_0+a_1(x-a)+a_2(x-a)^2+...+a_n(x-a)^n

然后从等式序列,g(a)=f(a),g'(a)=f'(a),...g'''''(a)=f'''''(a)......就得到所有的 a_0-a_n 的泰勒展示系数了。

泰勒级数展开函数,能做什么?对于特定的 x 取值,可以求它附近的函数。y=x^100 展开以后可以求 x=1 附近的 0.9999 的 100 次方等于多少,计算过程和结果不但更直观,而且可以通过舍弃一些高阶项的方法来避免不必要的精度计算,简化了计算,节省了计算时间(如果是计算机计算复杂数字的话)。

在图像处理的计算机软件中,经常要用到开方和幂次计算,而 Quake III 的源代码中就对于此类的计算做了优化,采用泰勒技术展开和保留基本项的办法,比纯粹的此类运算快了 4 倍以上。

还可以做什么呢? 对于曲线交点的问题,用方程求解的办法有时候找不到答案,方程太复杂解不出来,那么用泰勒级数的办法求这个交点,那么交点的精度要提高,相当于泰勒级数的保留项要增加,而这个过程对应于牛顿–莱布尼茨的迭代过程,曲线交点的解在精度要求确定的情况下,有了被求出的可能。

看到了吧,泰勒技术用来求解高方程问题,是一种通用的方法,而不是像中学时代那样一种问题一种解决办法,高等数学之所以成为”高等”,就是它足够抽象,抽象到外延无穷大。那么,更感兴趣的一个问题是,对于高阶的微分方程表达的问题,怎么求解呢? 泰勒级数不行了,就要到傅立叶级数-傅立叶变换-拉普拉斯变化。这几个工具广泛用于各个领域的数学分析,从信号与系统到数理方程的求解。

中学数学和高等数学最大的区别是什么?

中学数学研究的是定解问题,例如根号 4 等于 2。高等数学研究什么呢—-它包含了不定解问题的求解,例如用一个有限小数位的实数来表示根号 5 的值。我们用泰勒级数展开求出的根号 5 的近似值,无论保留多少位小数,它都严格不等于根号 5,但是实际应用已经足够了。不可解的问题,用高等数学的通解办法,可以求出一个有理数的近似解,它可以无限接近于上帝给出的那个无理数的定解。通解可行性的前提是,我们要证明这种接近的收敛性,所以我们会看到高等数学上册的课本里面,不厌其烦的,一章接一章,一遍又一遍的讲,一个函数,在某个开区间上,满足某个条件,就能被证明收敛于某种求和式子。初等数学求的是定解,那么如果没有定解呢? 高等数学可以求近似解。牛顿莱布尼茨就是切线逼近法的始祖。例如求解一般的 3 次方程的根,求解公式可以是定解形式,但是问题是根号内的无理数仍然无法表示出来。

那么逼近法求一个数的N次方根就派上用场了。

f(m)=m(k+1)=m(k)+[\frac{A}{m^2}(k)-m(k)]\frac1n,n是方次,A 被开方数。

例如,A=5,5 介于 1 的 3 次方至 2 的 3 次方之间。我们可以随意代入一个数 m,例如 2,那么:

第一步,2+[\frac5{2^2}-2]*\frac13=1.7;

第二步,1.7+[\frac5{1.7^2}-1.7]*\frac13=1.71;

第三步,1.71+[\frac5{1.71^2}-1.71]*\frac13=1.709;

每次多取一位数。公式会自动反馈到正确的数值。

具体的求解过程:先说说泰勒级数:一个方程,f(x)=0,求解 x,它唯一对应 x-f(x)二维图像上的一条曲线。那么 x 的求解过程可以用牛顿-莱布尼茨逼近法求得(迭代)。例如x^2=5 可以看成f(x)=x^2-5=0 的求曲线和 X 轴的交点。牛顿迭代法可以用来求解线性方程的近似解。那么如何求解非线性方程呢? f(x)用泰勒级数展开,取前 N 项(通常 N=2),得到一个线性的方程,这个方程相当于是原来的曲线在求解点附近做了一条切线,其求解过程和牛顿迭代法等价。迭代次数越多,越接近非线性。用泰勒级数来分解 sin(t),把一个光滑的函数变成一些列有楞有角的波形的叠加。用傅立叶级数来分解方波,把有楞有角的波形变成一些光滑曲线的集合。但是傅立叶级数舍弃项的时候,会产生高频的吉布斯毛刺(上升下降的边沿,迪利赫里条件不符合)。局部的收敛性不如泰勒级数展开—-因为泰勒级数展开有逐项衰减的常数因子。

举个例子,用泰勒级数求解欧拉公式。没有欧拉公式,就没有傅立叶变换,就没有拉普拉斯变化,就不能把高阶导数映射到 e 的倒数上面,也就无法把微分方程等价为一个限行方程。欧拉公式有什么用? 它把实数的三角运算变成了复数的旋转运算,把指数运算变成了乘积运算,把纯微分方程的求解过程变成了指数方程的求解过程,大大简化了运算。推广一下。怎么分析一个函数?怎么分析一个几何的相交问题?怎么解决一个多维的问题? 初等的方法是根据函数或者图形的几何性质,去凑答案—-当然大部分情况是凑不到答案的,因为能凑到答案是因为问题/题目给出了一些特殊的数学关系以使得我们恰好能凑到答案! 例如一个圆球在正方体里面,求通过某个顶点的切面方程或者距离什么的,我们可以通过做辅助面求得。

但是这个求解太特殊了,对于普通的点,

例如切面方程13x+615y+72z-2=0

这样的,初等方法就无能为力了。说白了初等方法就是牛顿在《自然哲学的数学原理》提到的几何方法,牛顿并没有把微积分上升到解析的思想。普通数学分析则提出了解析的代数运算思想,把具体的问题用通用的方式来求得,而问题的题设只是一种把函数的实际参数带入形式参数的过程,使得问题可以形式化了—-如果数学问题不能形式化就不能通过状态机来求解,试想,计算机怎么会画辅助线呢? 几何图形是有意义的,但是形式求解本身没有意义,它必须把实际的”意义”问题变成代数运算,例如求最大值最小值变成导数=0。

电路分析当中的模型是什么? 就是数学建模。

因为电压和电流是可以测量的量,那么我们就要看什么量是不变量/变量,什么量是自变量/因变量。如果电压是不变量,我们认为是理想电压源;如果电流是不变量就是理想电流源,如果电压电流的比例不变就是恒定电阻;如果电压电流乘积不变就是理想功率源。把控制电路作为一个整体,那么电压/电流控制电压/电流,作为一个黑盒,对外的特性就是电压转移系数,电流转移系数,转移电阻和转移电抗。在物理学的电场分析当中电压/电势是一个矢量,但是到了集总电路分析的领域就退化成了一个标量。对于复杂问题的分析,好比物理学当中的动量/能量守恒,电路分析是以电流守恒为基础的,于是就有了节电电流法和环路电压法的概念。这些概念的建立都是为了分析的目的而存在的,是分析工具。我们首先得到一个工具,当直接分析很困难的时候,我们采用逼近的方法来解决—-因为极限就是我们所求的。正是因为解析的思想是一种通用的求解方式,爱因斯坦在晚年才会追求 4 大场的统一理论,当然他忽略了这个”解析”的形式系统本身在量子的尺度上失效了,忽略了不确定性和概率的影响,令人惋惜。说的太远了,高数里面为什么有那么多种正交展开? 泰勒级数,傅立叶级数,罗朗级数—-其实就是因为初等的方法无法精确分析出定解,那么就去寻找一种”不断逼近”的方法来求解。复变函数研究的就是如何用幂级数不断的逼近原函数这个基本命题。

泰勒是怎么想出来的?

为什么泰勒级数,傅立叶级数,这些展开式都可以写成某个通项公式的和呢? 是不是真理都是简单的美的,就像毕达哥拉斯所设想的一样? 这个观点也许搞反了因果的方向。我们看一下泰勒级数是怎么得到的。

泰勒假设f(x)=f(a)+f'(x)(x-a)+o(x-a)^2

这个是牛顿莱布尼茨公式可以推出来的,那么有了一次项以后,如何继续逼近? 方法类似,一次的求解是g_1(x)=f(x)-f(a)=f'(x)(x-a),那么可以写出g_2(x)=f(x)-f(a)-f'(x)(x-a)两边对 x 求导再求不定积分,就得到了 2 阶的泰勒级数。依次类推,可以得到 N 阶的泰勒级数。由于每一阶的推导过程是”相似”的,所以泰勒项数的子项肯定也就具有了某种形式意义上的相似性。说白了,不是因为客观存在某种规律使得函数可以展开成具有通项公式的幂级数,而是为了把函数展开成具有通项公式的幂级数再去看每个子项应该等于什么,然后为了保证严格再给出收敛以及一致收敛的条件。

不是客观存在某种”简单而且美”的真理,而是主体把某种”简单而且美”的形式强加给客观,再看客观在”强加”语境下的特性如何。傅立叶级数的思想,频率分析的思想,和这个相似,是把我们心中的某个概念赋予外界的实在,按主管意识的想法来拆借外界—-只有这样,思想才能被理解。当然,实数范围的泰勒级数和傅立叶级数展开的条件仍然比较严格,复变函数引入了对应的洛朗级数和傅立叶/拉普拉斯变换,通用性强多了。说白了,复变函数就是函数逼近论。为了解决初等思想没法解决的不可能想明白的问题而引入的高等方法。

逼近思想的一个应用就是理解曲率的公式

A=\frac{|y''|}{\sqrt{1+y'^2}}

画出逼近图形就可以理解了,用两个相似三角形就可以证明这个公式。

复变函数说白了就是 2 维正交元素组成的数域。

(1+i)^i=e^{iLn(1+i)}=e^{i[Ln|1+i|+i(arg(1+i)+2k\pi)]}

=e^{-\pi(\frac14+2k)(cos[\frac{ln2}2])+i*sin[\frac{ln2}2]}

是一个正交的表达式,它保留了两个方向上的分量,使得 2 维分析变得可能。这样一来,高等数学当中的曲线积分,积分的变量不再是 x 和 y 而是只剩下了 z,形式上简单多了。

假设曲线积分 S1=S(Pdx+Qdy)其中Q=x^2-2xy-y^2,P=x^2-y^2+2xy,显然满足格林公式。

然后负数积分 S(z^2)dz=S(x^2+2xyi-y^2)d(x+yi)=S( (x^2-2xy)dx+(y^2-2xy)dy )

S(x^2+2xyi-y^2)d(x+yi)实部=S(x^2-y^2)dx-2xy^2dy,虚部=S(2xydx+(x^2- y^2)dy),实部和虚部相加就是 S1,也就是说,S 是 S1(曲线积分和路径无关)的复数形式。

我们可以验证 S(z^2)dz沿不同积分路线从起点到终点的积分结果。

z^2=(x^2-y^2)+i2xy,显然满足柯西-黎曼条件。于是它和实数积分的格林公式统一了。

实际的模型总是难以精确的解释的,所以我们创造一些理想模型去逼近现实。当然,两者不会相等,但是只要误差在容许的范围之内,我们认为数学的分析就成功了。这就是一切数学建模的思想。工科电子类的专业课,第一门数学建模的课程就是电路分析。这里传输线的问题被一个等效电路替代了。实际电源被一个理想的电压源加上一个电阻替代了,三级管放大电路的理论模型就是电流控制的电流源。一切都是为了分析的方便。只要结果足够近似,我们就认为自己的理论是有效的。出了这个边界,理论就需要修正。理论反映的不是客观实在,而是我们”如何去认识”的水平,理论是一种主观的存在,当实际情况可以影射到同一种理论的时候,我们说理论上有了一种主观的”普遍联系”,就像电路分析和网络流量的拓扑分析有很多共同点。这种普遍联系不是客体的属性,只和主体的观点有关。

说点题外话,对于工科电子类/计算机类的学生来说,我们学习了太多了经过精简压缩贯通的课程,以至于不知道了这些理论原有的面貌。有一种趋势就是把重要的思想性的原理性的东西去掉只留下工程实用性的内容下来。于是工科学生学到的都是”阉割”过的科学与技术—-缺少灵魂的学问是无法用来做研究的。

没有强大的数学基础,所谓的”科研”,只能是某种一边发明数学一边凑答案的抓狂,只能是空谈。还是老老实实的做项目,搞软硬件研发,开发市场,做技术支持,写报告,等等。

【数学】角谷(3n+1)问题的推广
【文摘】数学难题汇编(9)
【文摘】趣味逻辑学问题(5)
【文摘】趣味逻辑学问题(10)
【数学】经典悖论漫游(一)
【科普】进化从来没有发生过
【文摘】数学趣题汇编(9)
【人物】数学家高斯
【数学经典】素数之恋-伯恩哈德·黎曼
【数学】选举中的数学智慧

发表在 数学 | 标签为 , | 留下评论

【数学】柯尔莫哥洛夫

 Slava Gerovitch 返朴

踏入数学世界

如果两个统计学家在森林里迷了路,那他们首先要做的事情就是把自己灌醉,这样两个到处乱晃的醉汉或许能彼此相遇。但如果他们是要想背起竹筐采蘑菇,那还是少喝两杯为好,毕竟毫无目的的随机走动会让他们回到已经采摘过的地点。

这件事情在统计学中,被称之为随机游走(random walk)或者说是醉汉漫步(drunkard’s walk),这一模型表示,系统的未来状态仅取决于当前的状态,而与过去无关。时至今日,这一模型已经广泛地应用于股价建模、分子扩散、神经活动和种群动力学等过程,也可以用来解释遗传学中的“基因漂变”是如何导致某一基因(比如眼睛颜色)在人群中普遍存在的。

颇具讽刺意味的是,该理论模型不在乎过去、不在乎历史,但它本身却可谓是历史悠久。它是苏联数学家安德烈·柯尔莫哥洛夫(Andrei Kolmogorov,1903-1987)众多理论成就之一。这位奇才异能的数学家涉猎极广,他在平衡政治生活与学术生活的同时,也改变了“不可能”在数学中的地位。

柯尔莫哥洛夫(Андре́й Никола́евич Колмого́ров,1903.4.25-1987.10.20)丨图源:yarwiki.ru

后俄国革命时代的莫斯科文化思想活跃,当时氛围中充满着实验性文学、前卫的艺术与激进的新科学思想。年轻的柯尔莫哥洛夫也受此影响。在 20 世纪 20 年代初,柯尔莫哥洛夫还只是一名历史系的学生,那时他在莫斯科大学提交了一篇论文,对中世纪俄罗斯人的生活进行了非常规的统计分析。他发现,政府对村庄的课税往往是整数,而分到每家户人家时就成为了分数。因此,他认为在当时税收政策是按村缴纳再摊派到户,并不是按户纳税再由村庄收齐上缴。“孤证不立”,历史教授对他的发现给出了极为严厉的批评,“一个证据是不够的,你至少要找到五个例证。”

这也就不奇怪为何柯尔莫哥洛夫会投身数学——数学定理只证明一次就够了

学术理论背后的政治现实

柯尔莫哥洛夫转向概率论领域也同样源于一次偶然。当时,概率论这一数学分支的声誉并不太好,因为过去的人们总是把概率视为神灵意志的体现。在古埃及和古典希腊,人们就认为掷骰子是一种可靠的占卜和算命的方法。到了19世纪初期,欧洲数学家已掌握了一些正确计算概率的方法,并将概率定义为目标事件数与所有等可能事件数的比值。但其缺陷在于,概率是根据等可能的事件来定义的,因此只适用于元素有限的系统。面对无穷大的系统时,比如有无数个面的骰子,或者一个连续的球面,当时的概率论就显得捉襟见肘了。

然而,柯尔莫哥洛夫是珍惜声誉与名望的。换专业后,柯尔莫哥洛夫最先被莫斯科大学里的一个数学圈子所吸引。他们的领导者是一位魅力非凡的老师,尼古拉·卢津(Nikolai Luzin,1883-1950)。卢津的弟子们给这个组织起了个绰号叫卢津塔尼亚(Luzitania)——把卢津的名字和一战中被击沉的著名英国远洋邮轮卢西塔尼亚号(RMS Lusitania)连在了一起。如柯尔莫哥洛夫所说,他们是通过“共同的心跳”凝聚在一起。他们常在课后一起批判数学创新。在他们的口中,偏微分方程(partial differential equations)成了“偏不尊重方程”(partial irreverential equations),有限差分(finite differences)成了“美梦差分”(fine night differences)。那时,概率论因其理论根基不牢又悖论丛生,在他们口中就变成了“不幸论”(theory of misfortune)。

尼古拉·卢津 (Николай Николаевич Лузин,1883.12.9-1950.1.28),描述集合论的创始人之一,在三角级数、复分析、微分方程和数值计算等领域有杰出贡献。丨图源:ru.wikipedia.org

受卢津塔尼亚的影响,柯尔莫哥洛夫对概率论的态度也发生了转变。20 世纪 30 年代斯大林主义的恐怖活动爆发,秘密警察会在半夜敲响每个人的房门,毫无规律的随机性似乎统治了人们的生活。在恐惧的威慑下,很多人为了自保而告发他人。数学圈中的布尔什维克党活动人士里就有卢津的学生。他们以卢津在国外发表自己的研究论文为由,指控其政治上不忠诚并对其进行批判。柯尔莫哥洛夫也在国外发表过文章,出于对自己学术生涯的担心,他对政治问题表现出了明显的妥协。当莫斯科大学数学研究所所长因支持宗教而被监禁时,他接任了这一职位。此时,柯尔莫哥洛夫也加入了批判卢津的人群。卢津收到了来自苏联科学院的审判,失去了所有的职务,但他却逃脱了来自政府当局的逮捕和枪决。

与卢西塔尼亚号一样,卢津塔尼亚也被击沉了。不一样的是,卢津塔尼亚是被自己的船员击沉的。

“不可能”的大圆

且不谈柯尔莫哥洛夫的道德问题,他确实“赢了”,保住了自己的研究工作。而与他在政治上的顺从所不同的是,柯尔莫哥洛夫的研究思想却是比较激进的,他将概率论做了根本性的修正。他所使用的是一种由法国传入的名为测度论(Measure theory)的东西,当时算得上是时髦理论。测度论将长度、面积、体积等概念泛化,使得无法被常规方法测量的数学对象可能被测量。例如,一个有无限多个孔的正方形,被切割成了无穷多份并散落在了无限的平面中,借助测度论我们仍然可以表示出这个七零八碎的物体的“面积”(测度)。

柯尔莫哥洛夫在概率和测量之间进行了类比,得出了五个公理,现在通常表述为六个,他的工作使概率论真正成为数学分析中的一部分。他的理论中最基本概念是“基本事件(fundamental event)”,即单一实验的结果,例如掷硬币。所有基本事件构成了一个 “样本空间(sample space)”,即所有可能结果的集合。举个例子,假如某个区域常会出现闪电,样本空间就包括该区域所有可能发生闪电的位置 。一个随机事件被定义为样本空间中的一个“可测集(measurable set)”,而随机事件的概率则是可测集的“测度(measure)”。例如,闪电击中某位置的概率只取决于这个位置的面积(“测度”)。两个同时发生的事件可以用它们的测度的交集来表示;条件概率可以看成测度的相除;两个互不相容的事件其一发生的概率则用测度的加法来表示(也就是说,A或B被闪电击中的概率等于它们面积之和)。

大圆悖论(The Paradox of the Great Circle)就是通过柯尔莫哥洛夫的概率论得以解决的。大圆悖论是说,假设有外星人会随机降落到一个完美的球形星球上,且降落到每个点的概率也都是平均的,这是否意味着所有球体的大圆(great circle,即过球心的平面和球面的交线,把球体分成了两个相等的半球)上的降落概率都是一样的呢?其结果是,对于赤道所在的大圆而言,圆上每个点的概率是均等的。而对于经线来说,靠近赤道的点概率大,靠近两极的点概率小。这一发现或许可以用越靠近赤道纬度圈越大来解释。但是,这种结果与我们的直觉相违背,因为对于一个完美的球体而言,通过旋转,赤道可以变成任意一条经线。柯尔莫哥洛夫认为,大圆是一条线段,面积是零,因此测度为零。这一悖论的矛盾之处就在于我们无法严格计算相关的概率。

“大圆”,定义并不严格丨图源:en.wikipedia.org
大圈悖论在概率论中称为Borel-Kolmogorov 悖论,随机变量在以经线和纬线两种条件下的分布下得到了不同结果,实际上是测度为0的条件概率问题。丨图源:Yarin Gal

在零测度的条件概率世界中短暂的逃避了“大清洗”后,柯尔莫哥洛夫仍然要为现实世界的问题所困扰。二战时期,苏联当局要求柯尔莫哥洛夫研究提高炮火效率的方法。柯尔莫哥洛夫发现,在某些情形下,与其提高每一颗炮弹的命中率,还不如对小幅度偏离目标的范围进行连续猛击。这一策略被称之为是“人工散布(artificial dispersion)”。在柯尔莫哥洛夫主持下的莫斯科大学概率系也计算了低空、低速轰炸的弹道表。为表彰柯尔莫哥洛夫在二战时期的贡献,苏联政府于1944年和1945年授予了他两枚列宁勋章。二战后,他担任了热核武器计划的数学顾问。

洞察艺术世界的概率视角

出于专业兴趣,柯尔莫哥洛夫实际上对哲学更加有所偏爱。数学出身的他相信,这个由随机决定的世界却有序运行,其背后也有概率论的规律可循。他常常思考那些“不可能”的事情在人类生活中的影响。

1929年,在一次独木舟旅行中,柯尔莫哥洛夫与数学家帕维尔·亚历山德罗夫(Pavel Alexandrov,1896-1982)相遇,从此二人也成为了终生的好友。在一封长信中,亚历山德罗夫坦率地指责柯尔莫哥洛夫喜欢在火车上与人攀谈,并暗示这种交际太肤浅,并不能真实地了解一个人。而柯尔莫哥洛夫表示了反对,他以一种激进的概率论视角来看待社会交际。在这样的交际互动中,交际的对象是更大群体的统计样本。“人会从环境中领悟真谛,并将养成的生活方式与世界观带给周围任何的人,不只是特定的朋友。”柯尔莫哥洛夫在回信中说。

对柯尔莫哥洛夫来说,音乐和文学也非常重要,他相信自己可以从概率的视角去洞察人类心灵的运作方式。他也是一个文化精英主义者,认为艺术的价值是分三六九等的。最顶尖的就是歌德、普希金和托马斯·曼的著作,还有巴赫、维瓦尔第、莫扎特和贝多芬的音乐作品——这些作品的永恒的价值类似于永恒的数学真理。柯尔莫哥洛夫强调,每一件真正的艺术作品都是独一无二的,是所谓“不可能”的事物,是超脱统计规律以外的事物。他在1965年的一篇文章中讽刺地问道,“有没有可能把‘托尔斯泰的《战争与和平》’以一种合理的方式纳入‘所有可能的小说’集合中,并进一步假定这一集合中存在某种特定的概率分布?”

同时,柯尔莫哥洛夫也渴望能找到解密艺术创作本质的钥匙。1960年,柯尔莫哥洛夫为一组研究人员配备了机电计算器,指派他们计算俄罗斯诗歌的节奏结构。柯尔莫哥洛夫对实际韵律与古典韵律的偏差特别感兴趣。在传统诗学中,抑扬格是由一个非重读音节跟着一个重读音节组成的。但在实际的创作中,这条规则却很少被遵守。普希金的《叶甫盖尼·奥涅金》是俄语中最著名的古典抑扬格诗,全诗的5300行中,几乎有四分之三的诗句违反了抑扬格定义,超过五分之一的音节都非重读音节。柯尔莫哥罗夫认为,重音偏离古典韵律定义的频率为诗人提供了一个客观的“统计画像”。在他看来,一种不太可能出现的重音模式恰好反映了艺术的创造性和表现力。通过对普希金、帕斯捷尔纳克和其他俄国诗人作品的研究,柯尔莫哥洛夫认为,诗人对韵律格式的独特运用,奠定了自己作品的“调性”。

为了衡量文本的艺术价值,柯尔莫哥洛夫还采用了字母猜测法来估算自然语言的熵(entropy)。在信息论中,熵是对不确定性或不可预测性的度量。对于信息而言,一份信息的不可预测性越大,它所携带的信息量就越多。在柯尔莫哥洛夫眼中,熵成为了一种评价艺术独创性的指标。他的研究小组进行了一系列实验:给志愿者们展示一段俄罗斯散文或诗歌,并让他们猜下一个字母,再猜一个,以此类推。柯尔莫哥洛夫私下说过,从信息论的观点来看,苏联报纸的信息量不如诗歌。因为政治话语会使用大量的固定短语,内容更容易预测。而对于诗歌来说,尽管存在严格的格律要求,但那些伟大诗人的作品却难以预测。他认为这就是诗人的独特标志,也是艺术上的不可能,但概率论有助于衡量艺术的价值。

虽然将《战争与和平》这样的小说置于一个概率样本空间的想法遭到了柯尔莫哥洛夫的蔑视,他却可以通过计算《战争与和平》的复杂性来表达其不可预测性。柯尔莫哥洛夫假设,复杂性是一个对象的最短描述长度,或者是生成一个对象的算法的长度。确定性的对象的描述是简单的。比如,它可以通过一个周期性的0和1组成的序列产生。但不确定的、真正随机的对象则是复杂的,任何生成算法的长度都必须和对象本身一样长。比如,无理数,小数点以后的数字没有规律可循(循环小数可用一个简洁的分数来表示)。因此,大多数无理数都属于复杂对象,因为要描述它们就只能原样再写一遍。这种对复杂性的理解是符合直觉的,即没有任何办法去预测、描述一个随机对象。今日,这一观点对于衡量一个物体所需的计算资源非常重要,在网络路由、排序算法和数据压缩都有所应用。

柯尔莫哥洛夫与他创办的学校学生一起丨图源:internat.msu.ru

了解不可能就是最大的可能

按照柯尔莫哥洛夫的标准来看,他自己的一生也是复杂的。柯尔莫哥洛夫于1987年去世,享年84岁。他一生经历过俄国革命、两次世界大战和冷战,而在学术上他几乎触及了数学的一切领域,其影响也远超学术界。无论他的人生历程属于“醉汉游走”,还是“不走回头路的采蘑菇之旅”,这一段历程都难以预测,难以描述。他在描述并应用“不可能”的成功,使概率论真正成为“可能”,由此为无数科学与工程应用开辟了新的天地。当然,对于不可预测性,他的理论也拉大了人类所拥有的直觉和数学理论之间的差距。

对于柯尔莫哥洛夫来说,他的思想既没有消除不确定性,也没有肯定我们世界根本上的不确定。他只是提供了一套严谨的语言来讨论那些无法确定的事情。他曾经说过,“绝对随机”并不比“绝对必然”更有意义,我们无法对不可知的事物存在确切的认知。

但要感谢安德烈·柯尔莫哥洛夫,我们可解释自己何时以及何因不知道。

【文摘】大学生数学竞赛题汇编(5)
【文摘】国际象棋中的趣题妙解
【人物】数学家丘成桐
【文摘】趣味逻辑学问题(6)
【数学】天使,魔鬼游戏
【数学】经典悖论漫游(二)
【程序】八皇后动态图形的实现
【圣经】神的创造:人体的奥妙(3)
【数学】一道怪怪的数学题
【数学】3x+1问题(4)

发表在 数学 | 标签为 , | 留下评论

【数学】赌博与概率论

数学与通识

概率论是一门既古老又年轻的学科。说它古老,是因为产生概率的重要因素—赌博游戏已经存在了几千年,概率思想早在文明早期就己经开始萌芽了。而说它年轻,则是因为它在十八世纪以前的发展极为缓慢,现代数学家和哲学家们往往忽略了那段历史,他们更愿意把1654年帕斯卡(Pasac)l和费马(Fomrat)之间的七封通信看作是概率论的开端。这样,概率论的“年龄”就比数学大家族中的其它多数成员小很多。一般认为,概率论的历史只有短短的三百多年时间。虽然在早期概率论的发展非常缓慢,但是十八世纪以后,由于社会学,天文学等其它学科的研究需要,使得概率本身的理论得到了迅速发展,它的思想和方法也逐渐受到了其它学科的重视和借鉴。在当代,随着概率论本身的发展和学科之间的交叉融合,囊括了概率理论和统计理论两大部分的广义概率论已经成为一门应用非常广泛的学科,概率方法与统计方法逐渐渗透到了其它学科的研究工作当中。无论是在自然科学领域还是社会科学领域,各门学科中都能看到概率论的身影。概率论已经成为一种重要的工具,在社会发展中发挥着巨大的作用。

机会的早期计算

古希腊人从航海实践中发现了许多概率经验规律, 古犹太人在纪元之初就有概率加法定律和乘法定律的应用记录。但是由于结果不确定的特点, 人们一直认为随机现象好似运气都由天神决定, 其规则是世俗不可想象的。能够刺激人们思考概率的事情很多, 但最终孕育概率论的却是庸俗的骰子赌博。公元 960 年左右, 怀特尔德大主教计算出掷三个骰子时不计次序所能出现的不同组合有 56 种。十三世纪左右拉丁诗歌《维图拉》指出这 56 种组合出现的机会不是相同的: 3 枚骰子点数一样, 每个点数只有一种方式; 2 枚骰子点数一样而另一枚不一样, 则有 3 种方式; 如果 3 枚都不一样就有 6 种方式。但是这些经验并没有引起更多的思考, 机会的计算仍处于直觉的、散乱的经验水平上。

卡尔扎诺是一位医学博士, 曾在米兰讲授数学, 写过多部医学、数学等方面的著作。他认为赌博是一种社会病, 也有理由作为可以医治的疾病来研究。约在 1564 年, 他集中了自己的智慧和赌博经验, 用拉丁文写出著名的《论机会游戏》, 揭示了赌博中的不确定性原理, 成为概率论前史的重要人物。书中, 卡尔扎诺强调赌博的基本原则是同等条件,“如果它们有利于对手, 那么你是傻瓜, 如果有利于自己, 那么你就不公平”。骰子应该是“诚实的”, 几个诚实的骰子联合起来仍然是诚实的, 下注应该根据这种诚实性。等可能思想的提出是卡尔扎诺的贡献之一, 为理解和解决复杂的赌博问题提供了依据。他定义了胜率(有利结果数与不利结果数之比) 表示机会的大小, 计算出了多种赌博的全部可能结果数和有利结果数, 由于当时组合数学还很贫乏, 他的计算在方法上与《维图拉》基本相同。卡尔扎诺还思考了独立事件的乘法法则, 在一番错误推理后他发现了正确方法, 例如一次的胜率是 3:1, 连续两次的胜率是 9:7。卡尔扎诺是第一个深入讨论概率问题的人, 他提出了考虑随机问题的基本原则, 建立了胜率概念和一些运算法则, 对概率理论的形成具有开创性贡献。但是他也犯了不少错误, 例如他认为在掷两个骰子时, 36 次投掷有 1 次机会出现双 6, 平均起来 18次投掷中, 出现双 6 的机会是 50%。这种推理意味着36 次投掷中必定出现一次双 6, 他没有意识到自己的错误。由于该书只有很少部分讨论机会计算, 其等可能思想来自赌博直觉, 很多结论缺少有效推理。该书是在他死后 87 年才出版, 此前惠更斯的《论赌博中的计算》已经刊世, 这削弱了他应有的学术影响,所以后人多数不称他是概率论缔造者。

古典概率时期(十七世纪)

人们对偶然现象(即随机现象)规律性的探求,经历了相当长的历史时期,甚至可以追溯到远古的原始社会。最早,人们对事物的偶然性并不重视,他们认为这是“微不足道的”,而只注意那些有一定必然规律的现象。但是,严酷的现实使人们感到这种观点是错误的,因为火灾、水灾、地震等偶然现象一当发生,便给人们的生命财产带来不可估量的损失。随之,又认为偶然现象是“可怕的”,“严重的”。但是,在实践中人们又发现,事物的偶然性不仅有可怕的一面,也有造福于人类的一面,例如久旱后偶遇甘霖,就是大喜之事。这样,人们开始探讨偶然现象发生的规律性。由于生产力水平,科学文化知识所限,长期以来人们对偶然现象的规律性探求进展十分缓慢,甚至有人提出它是“神秘的”,“不可捉摸的”。直到唯物辩证法产生,才开始从研究偶然性与必然性这一对矛盾的对立统一中加深了认识。恩格斯在《路德维希·费尔巴哈和德国古典哲学的终结》一文中指出:“在表面上是偶然性起作用的地方,这种偶然性始终是受内部的隐蔽着的规律支配的,而我们的问题是在于发现这些规律。”马克思主义的认识论,给人们指出了认识偶然性的正确方法。

现代人认为概率论的早期研究大约在十六世纪到十七世纪之间。这段期间,欧洲进入文艺复兴时期,工业革命已开始蔓延。伴随工业发展提出的误差问题,伴随航海事业发展产生的天气预报问题,伴随商业发展而产生的贸易、股票、彩票和银行、保险公司等,加之人们越来越需要了解的患病率、死亡率、灾害规律等问题,急需创立一门分析研究随机现象的数学学科。概率论应社会实践的需要出现了。在这个时期,意大利著名物理学家伽俐略就曾对物理实验中出现的误差进行了科学的研究,把误差作为一种随机现象,并估计了他们产生的概率。

有人认为,概率论的起源是对赌博的研究,这种看法是不全面的。概率论和其它学科一样,其生命力来源于生产力发展的需要。但是,也应当尊重历史,早期刺激数学家思考概率论的一些特殊问题是来自赌博者的请求。那时的概率论工作者的贡献正在于他们善于从具沐的赌博问题中,看到它们的实际背景,并致力于把它们的研究成果从实际问题上升为理论,使概率论成为一门有坚实社会基础,应用日益广泛的学科。以研究赌博问题称著的惠更斯在他1657年出版的《论赌博中的计算》集子中有一段很深刻的话:“在任何场合我认为如果读者仔细研究对象,当可注意到你所处理的不只是赌博而已,其中实际上包含着很有趣很深刻的理论的基础。”

梅尔还向数学家巴斯卡们请教过一个著名的分赌本的问题:“两个赌徒相约赌若千局,谁先赢s局就算是赢。在一人赢a(<S)局,另一人赢b(<S)局,赌博中止。问赌本应怎样分才合理。”1654年7月30日,巴斯卡将自己的解法写信告诉数学家费尔玛,后来惠更斯参加了他们的讨论,并将解法写进了他的著作《论赌博中的计算》。这是最早的概率论论著。他们的计算都有按赢得整局赌博的概率的比例来分赌本的思想,即朴素的数学期望的思想。

关于“分赌本”问题,早在十六世纪西欧就有讨论。路加、巴巧罗曾提出按已赢局数的比例分配。后来,意大利医生加尔达诺指出,这样做未考虑到每个赌徒能够再赢的局数,但他找不到正确的解法。加尔达诺曾著《论赌博》一书,在他死后的1663年出版,书中已计算了掷两颗或三颗骰子有多少方法得到某一总点数。更早的塔塔利亚也作过类似的计算。

初等概率时期(十八世纪)

十八世纪,概率论发展很快,几乎初等概率的全部内容都在这个期间形成。在这个期间,概率论工作者以不是孤立地、静止地研究事件发生的概率,而是把随机现象视为一种特殊的变量—随机变量。恩格斯在《自然辩证法》中指出:“有了变数,运动进入了数学;有了变数,辩证法进入了数学”。随机变量的引入,数学家如鱼得水,他们利用各种数学工具,研究随机变量的分布,从而使概率论的研究得到了一次飞跃。

法国杰出的数学家德莫哇佛尔最早研究了随机变量服从正态分布的情形,发现了正态概率分布曲线。这一重大发现有着不可磨灭的功绩,因为在众多的随机现象中,服从正态分布的随机现象是占绝大多数的。接着,他又发现,许多分布的极限正态分布,并证明了二项分布当p=q=1/2的情形。这种证明某一分布的极限是正态分布的各种定理,以后发展成概率论的一个重要组成部分—中心极限定理。

1740年,英国数学家心普松的《机会的性质与规律》出版。在书里,他所研究的问题中有一个对产品剔废及检查很重要的问题:设有n件等级不同的产品,n1件属于第一级,n2属于第二级,……,我们任意取其中的m件,试求其中取得m1件第一级,m2件第二级,……的概率。这就是现在常用到的多项分布的情形。

分析概率时期(十九世纪)

在整个十八世纪和十·九世纪初叶,概率论风行一时。但是,由于一些学者过分夸大了它的作用,许多人企图把它应用到诸如诉讼之类的“精神”或“道德”的科学上去,遭到了失败。这以后,欧洲的一些数学家认为概率论只是一种数学游戏,不可能有重大的具有科学根据的应用。甚至概率论在气体动力论、误差论、射击论等方面的卓有成效的应用也因此而受到忽视。这些错误后来被形容为“数学诞语”,导致概率论的发展在西欧较长的一段时间(十九世纪下半叶)出现停滞。

虽然概率论在这段时期走了一段弯路,但它的发展仍是主流。在这个时期,概率论工作者较好地应用数学工具,使概率论的理论更加严密,基本上完成了概率论作为数学的一个分支应具备的条件。拉普拉斯1812年在巴黎出版了他的经典著作《分析概率论》。这部著作对十八世纪概率论的研究成果作了比较完美的总结,内容包括几何概率、贝努里定理、最小二乘法等。他还明确了概率的古典定义,证明了中心极限定理中的德莫哇佛尔—拉普拉斯形式,发展了概率论在观察和测量误差方面的应用。可以说,他是严密地,系统地奠定概率论基础的第一个人。不足之处在于他对概率的定义缺乏深入的讨论,只是企图把任何一个概率问题,勉强纳入简单的等可能模型。他还有很多著作:《论事件原因概率》、《概率论报告》、《关于叙列的报告》、《概率论的哲学探讨》。

法国数学家波阿松通过研究,发现了在概率论中占重要地位的一个分布—波阿松分布。他还推广了大数定律,在1837年他的《关于民型审判的概率研究》著作中,第一次提出了“大数定律”这一名称。波阿松还是第一个把概率论用到解决射击问题上的数学家。

德国数学家高斯是历史上伟大的数学家之一,他的名字在数学史上与阿基米德、牛顿、欧拉等并列。1809年,高斯发表了他的名著《天体沿园锥曲线绕日运动的理论》,书中首次叙述了在统计学中十分重要的最小二乘法原理。这个原理数学家勒让德在1806年曾谈及过,但高斯1794年已开终使用。此外,高斯对正态分布进行了深入的讨论,并运用于射击和误差理论。

十九世纪后半叶概率论有了很大的发展,这是同俄国的几位数学家的努力分不开的。

非洲几何学的创始人罗巴契夫斯基留下的丰富数学遗产中有两篇概率论作品。他并不研究概率论,他对概率论的兴趣是从几何学研究中得到的。布尼亚科夫斯基为了在俄国推广概率论,1846年出版了俄罗斯的第一本教科书《数学概率论基础》。虽然他受拉普拉斯和波阿松的影响,书中有不少论述是把概率论用于“伦理科学”的错误观点,但这部著作的意义仍是很重大的。布尼亚科夫斯基在该书绪言中说:“既然我们至今还没有任何关于数学概率论的专书,甚至连译本都没有,则我们面临要用俄罗斯的术语来写一门还没有通行辞藻和表达方法的新科学这样的一种困难。”事实上,布尼亚科夫斯基采用的术语大部分已在俄国的文献中生了根。此外,他广泛地在俄国推行把概率论应用到统计学,特别是在保险事业和人口统计上也是卓有功绩的。

布尼亚科夫斯基的优秀学生切比雪夫发表的概率论论文虽然只有四篇,但它们对后来概率论的影响是难以评价的。以他的名字命名的切比雪夫不等式。同时,他作为基础知识在概率论和数理统计中起着十分重要的作用。切比雪夫的概率论思想为后来俄罗斯概率论学派的杰出工作奠定了基础。按研究的性质来说,这个学派的活动大致可分为两个时期:第一个时期代表人物有马尔科夫,李雅普诺夫。这个时期的特征是研究独立随机变量叙列和马尔科夫链概型。第二个时期的代表人物是辛钦和柯尔莫哥洛夫。这个时期的特征是将实变函数的观点和方法引入概率论中。切比雪夫的学生马尔科夫研究了一种离散的随机序列,这种序列的特点是“无后效性”。后来人们称之为马尔科夫链”。广义的理论后来成为一类独立的学科—随机过程。马尔科夫还推广了大数定律和中心极限定理的应用范围。切比雪夫的另一个学生李雅普诺夫证明了较广泛条件下的中心极限定理。为了证明这个定理,他创造了特征函数方法。这种方法已成为概率论的基本工具之一。从十九世纪八十年代起,英国生物学家高尔顿和皮尔逊建立了“变异”、“相关”、“回归”等概念,并将概率论应用于进化论和生物学研究。顺便提及的是,皮尔逊原是一个物理学家,他花了五十年的时间研究统计学,还在1911年于伦敦创办了世界卜第一所统计学校。

现代概率时期(二十世纪)

二十世纪以来,概率论有了很大的发展。由千公现化体系的建立,使得概率论的理论更加完备。另外,极限理论的研究取得了一系列的结果。随机过程,数理统计从概率论中独立出来,成为两门生命力极强的新学科。概率的应用性越来越显示出来,产生了应用概率的研究分支,并由此滋生出许多分支。概率论与其它学科相结合,又出现了不少边缘学科。二十世纪初,随着概率论的发展,人们越来越发现它的基础不牢固,明确定义概率成为一个非常突出的问题。十九世纪以来,数学各分支都纷纷出现公理化潮流。集合论的发展使人们认清了事件,测度论的发展使人们了解了概率的实质,特别是实变函数论中的勒贝格测度和积分的研究,都为概率公理化定义的出现创造了条件。1933年,柯尔莫哥洛夫顺应潮流,在他的《概率论的基本概念》一书中,叙述了他的定义。这个定义以勒贝格测度为理论基础,抓住概率的有界性、非负性、可加性三条最基本的性质来定义概率。这种定义在逻辑关系上和别的数学分支完全相仿,从而使概率论成为一个严谨的数学分支。

二十世纪以来,美籍南斯拉夫数学家费勒及法国数学家列维在极限理论方面开展了一系列有益的研究工作。1935年,费勒找到了满足中心极限定理的充要条件,后来数学界称这个条件为费勒条件。费勒在马尔科夫过程论的研究中对首先引用半群理论作了很有意义的研究。对现代数理统计作出决定性贡献的是英国数学家费歇尔。他以医学、生物实验为背景,提出了似然方法;开创了试验设计、方差分析;确立了统计推断的基本方法(二、三十年代)。原籍波兰的美国数学家奈曼和皮尔逊,从1928年起,建立了严格的假设检验理论。1946年,瑞典数学家克拉梅尔出版了《统计数学方法》。这部著作收集了半个多世纪以来的数理统计研究成果。它的出现,标志着数理统计作为一门独立的数学分支正式确立。

第二次世界大战以后,数理统计的理论开始向纵深发展。四十年代末,美国数学家瓦尔德创立了统计判决理论。他的想法是把形形色色的统计问题归并在一个统一的模型下以便进行统一的处理。许多数理统计分支,如参数估计,都受到这种理论的影响而得到发展。由于概率论中极限理论的发展,正态分布作为统计量的地位越来越明显,统计中的大样本理论由此而得到迅猛的发展,参数估计中的极大似然估计,稳健统计,自适应估计,随机逼近、非参数统计等都发展较快。另外,贝叶斯统计学派在这个时期复兴并发展。近年来,由于电子计算机的广泛应用,统计中的大量计算工作变得容易。另一面方,计算机在短时间内处理大量数据的功能,在一定程度上降低了数学模型的作用。近几十年来,数理统计中纯数学比重加大,所用的数学工具越来越精深,许多实际工作者感到难于问津,又出现一种理论与实际“分家”的趋势。

随机过程产生是近代概率论发展的重要标志之一。古典概率论主要研究随机事件的概率或随机变量的分布,而现代概率论则主要研究无穷多个随机变量的集合,即研究随机过程。继马尔可夫链产生后,柯尔莫哥洛夫建立了马尔科夫过程的一般理论;美国数学家维纳由于研究控制论的需要,首先讨论了平稳过程的预测理论;1934年,苏联数学家辛钦建立了平稳随机过程理论;1937年,克拉梅尔开始研究随机过程的统计理论;美国数学家杜勃进一步研究随机过程,在经典鞍论上做了发展性的工作。

随机过程按研究的性质分类,又可分为马氏过程,平稳过程,软、正态过程,点过程等。它与其它学科结合,又产生了许多边沿分支:与微分方程、数理统计、数论、几何、计算、数学相结合,出现了随机微分方程、过程统计、数论中的概率方法、几何概率、计算概率等等。近十年间,还出现了无穷质点的随机过程、点过程现代理论、马氏过程与位势论等新研究方向。

1955年,在美国数学年会上,第一次提出了“应用概率”。这种应用性很强的研究方向,在社会科学数量化、精确化中;在日益需要的自动控制和管理学中,越来越受到人们的重视。应用概率的诸分支又有:排队论、可靠性理论、马尔科夫决策规划、对策论、信息论、随机规划等等,还有与其它学科的结合分支:生物统计、药学统计、军事统计、气象统计、水文统计等等。

可以预见,随着科学技术的发展,概率论的理论与应用也将得到更大的发展。作为数学的分支,概率论的高度抽象性、广泛应用性、体系严谨性的特点在发展中将愈来愈明显地显示出来。

【文摘】大学生数学竞赛题汇编(5)
【文摘】国际象棋中的趣题妙解
【人物】数学家丘成桐
【文摘】趣味逻辑学问题(6)
【数学】天使,魔鬼游戏
【数学】经典悖论漫游(二)
【程序】八皇后动态图形的实现
【圣经】神的创造:人体的奥妙(3)
【数学】一道怪怪的数学题
【数学】3x+1问题(4)

发表在 数学 | 标签为 | 留下评论