顶尖数学家苦思数十年的高斯相关不等式难题,被一退休老人破解了
2014年7月17日早晨,名不见经传的德国退休统计学家托马斯·罗恩(Thomas Royen)刷着牙,突然灵光一现,想到了一个著名数学猜想的证明方法。这个猜想处在几何学、概率论和统计学的交叉点上,顶尖专家们苦思冥想了几十年,仍未能破解。 它就是著名的高斯相关不等式(Gaussian correlation inequality;下简称GCI),诞生于上世纪50年代,最通俗易懂的形式出现于1972年,从此令数学家们梦牵梦绕。“我知道有人为了证明它,花了40年时间。”宾西法尼亚州立大学统计学家唐纳德·理查兹(Donald Richards)说,“我自己就花了30年。” 一直到大致思路闪现之前,罗恩从没有认真想过如何证明高斯相关不等式。他早年是在医药公司工作,1985年进入德国宾根的一所小型理工大学,以便拥有更多时间,去改进医药行业用于分析药物试验数据的统计公式。2014年7月,虽然已是67岁的退休人士,他仍孜孜于这项事业,并发现,GCI可以拓展到他很擅长的一个统计分布中去。7月17日那天早上,他突然想到一个关键导数的计算方法,并以此证明了经他拓展后的GCI。“到那天傍晚,我的第一份证明草稿就已经完成了。”他说。 由于不知有LaTeX这项工具(数学领域重要的软件工具),他将计算过程手动输入了Word文档,并于8月份将论文发表于学术预发表网站arxiv.org,还寄了一份给理查兹。一年半前,理查兹曾将自己失败的证明过程发给圈内人传阅。“我收到他发来的论文。”理查兹说,“只看了一眼就意识到,这就是正解。” 托马斯·罗恩在德国的家中 见到证明过程时,“我真是后悔不迭。”理查兹说。几十年来,他和其他专家为攻克GCI,采用的数学方法越来越高深,一心以为,要证明这个猜想,就得用到凸几何学、概率论或分析学领域的大胆新思路。由于多年苦思无果,一些数学家甚至开始怀疑,这个不等式也许根本就是错的。结果,罗恩的证明简单明了,只有区区几页纸,而且用到的都是经典数学技巧。这么多人居然都没有想到,理查兹觉得很不可思议。“不过我不得不说,看到证明时,我整个人都松了口气。”他说。“我曾经想过,要是我死前能看到证明,那死也瞑目了。”他笑着说,“真的,我感到非常欣慰。” 理查兹将消息通知了几位同事,并用LaTeX帮罗恩重新打印了论文,好让它显得更加专业。理查兹和罗恩还将论文发给了其他专家,但面对这一戏剧性的突破,这些人似乎很是不屑。 因为这些年来,自称证明GCI的论文层出不穷,没有一千也有八百。魏茨曼科学研究所和特拉维夫大学的博阿兹·克拉塔格(Bo’az Klartag)回忆起当初的情景:2015年,同事给他发来一封邮件,内含三篇证明GCI的论文,其中一篇就来自罗恩。他随手打开一篇检查起来,很快就发现一个错误,后来忙于别的事情,另两篇就没有再看。出于这样那样的原因,罗恩的证明迟迟没有受到认可。 由于作者的来头很小,这种证明在一开始被忽略也是常有的事,但这种情况持续不了多久。专家们称,一般情况下,罗恩这样的论文会被投递给《统计年鉴》(Annals of Statistics)这样的刊物,发表之后就众所周知了。但作为退休人员,罗恩已经不追逐什么远大的前程,考虑到顶级期刊都有缓慢而严格的同行评审流程,他选择了跳过这个步骤,将论文发表在了《远东理论统计学报》(Far East Journal of Theoretical Statistics)上。该期刊总部位于印度阿拉哈巴德,基本不为业内专家所知,而且,它的网站上还将罗恩列为编辑之一,不免令人生疑。(他在前一年应邀加入了该报的编辑委员会。) 因为这个头衔挂在那里,罗恩的证明就这样一直被埋没着。直到2015年12月,波兰数学家拉法尔·拉塔拉(Rafał Latała)和学生达瑞斯·马特莱克(Dariusz Matlak)发表了一篇论文,将罗恩的证明广而告之,并加以重新组织,使之更易于理解。随后,消息开始流传开来。 至于身处21世纪,这个消息为何传播得如此之慢,谁都说不清楚。“这显然是信息交流匮乏的结果,虽然这是一个通讯发达的时代。”克拉塔格说。 “不管怎么说,至少它没被埋没。”他说,而且“如此美好。” 知名度最高的GCI表述成形于1972年,它将概率论和几何学联系到了一起:它在掷飞镖游戏中,包括更高维度的假想飞镖游戏中,给飞镖的位置概率确立了一个下限。 假设有两个凸多边形,一个是矩形,另一个为圆形。现在将两者重合的中心点当作靶心,向其投射飞镖。最终,这些飞镖的位置分布曲线将是一条钟形曲线,即呈“高斯分布”。高斯相关不等式提出了这样一种猜想:飞镖落入矩形和圆形重合区域的概率永远大于或等于落入矩形区域的概率乘以落入圆形区域的概率之积。简单点说:由于两个形状存在重合,所以,投中其中一个时,投中另一个的概率也会提高。而且,只要中心点重合,任意维度的任意两个对称凸多边形,都适用于这一原则。 有人证明过特定条件下的GCI猜想。比如1977年,弗吉尼亚大学的洛伦·皮特(Loren Pitt)就证明,若将条件限制为二维平面中的凸多边形,则猜想成立。但没有一个数学家能够给出任意维度条件下的通用证明。皮特的尝试始于1973年,当时,他在新墨西哥州开会,午饭时第一次从同事口中得知了这个不等式。“作为一名心高气傲的年轻数学家……这让我大吃一惊:数学和科学界这么多以长辈自居的牛人,居然没有一个人能解出来?”他说。于是,他把自己关进旅馆房间,自信在走出那扇门之前,一定能将其证明或证伪。“快50年过去了,我依然没有答案。”他说。 虽然层层叠叠的草稿没有带来任何结果,但皮特等数学家抓住二维平面条件下的GCI被证明一事,坚信通用证明必定存在。“面对这个问题,我渐渐形成了一种思维定式,可能我太执着于这个思路了。”皮特说,“而罗恩的思路与我的完全不同。” 罗恩的证明可以追溯到他在医药产业的从业经历,以及高斯相关不等式本身鲜为人知的起源。在以“对称凸多边形”这种表述出现以前,GCI于1959年就诞生了,美国统计学家奥利弗·多恩(Olive Dunn)提出这一不等式,用来计算“同步置信区间”,即多个变量会同时落入的估计区间。 假设我们要基于一个人口样本,估计总人口之中,95%的人的体重与身高会落入哪个区间。如果将体重和身高分别标记在x轴和y轴上,那么,体重数据就会沿x轴呈钟形曲线分布,身高数据则沿y轴呈钟形曲线分布。如此一来,体重与身高就共同构成了一种二维的钟形曲线分布结构。然后你就可以计算:如何界定体重与身高的区间(分别设为-w < x < w和–h < y < h),才能使95%的人口落入两个区间形成的矩形之内? 如果体重与身高是相互独立的,那么,你只要计算出体重落入–w < x < w区间的概率,以及身高落入–h < y <h区间的概率,然后两者相乘,就能得出两个条件同时满足的概率。但在现实中,体重与身高是相互关联的。这就好比向上述重叠形状的中心点投掷飞镖:如果一个人的体重落入普通区间,那么此人的身高也很有可能处在普通水平。多恩将三年前提出的一项不等式进行了拓展,提出了这样一个假设:两个随机变量同时落入矩形区间的概率永远大于或等于每个变量落入各自区间的概率之积。(其中,变量的数量可以任意拓展。)如果变量之间相互独立,则联合概率等于各独立概率之积。但只要变量之间存在些许相关性,联合概率就会增加。 罗恩发现,他可以将GCI拓展开来,从随机变量的高斯分布,拓展到范围更广的统计学分布,即一些统计学测试中用到的“伽玛分布”。他说,“数学中经常出现这样的情况:一个问题看似很难,也很特殊,但通过解答一个更宽泛的问题,就能找到这个问题的答案。” 在拓展后的GCI中,罗恩用字母C代表变量之间的相关性,并定义了一个新的函数,其值由C决定。当C=0时(即变量之间不相关,如体重和眼睛颜色),函数等于各独立概率之积。当C达到极值,即C=1时,函数等于联合概率。为证明后者大于前者,且GCI成立,罗恩就得证明:其函数值永远随C的增加而增加。即要证明,该函数在C等于各值时的导数(即变化率)永远为正。 对伽玛分布的驾轻就熟激发了罗恩的灵光一现。之前,他就已经想到,一种经典的数学技巧可以将函数变形、简化。但那天,罗恩突然意识到,变形后函数的导数就等于原函数的导数变换式。他能轻而易举地证明后者导数永远为正,从而证明GCI。“他能证明GCI,离不开他掌握的一些公式。”皮特说,“我没有这些公式。” 专家们说,统计学专业的研究生都能看懂证明过程。罗恩表示,这个“出奇简单的证明方法……也许能鼓励年轻学子发挥创造力,发现新的数学定理,”因为“有时候,你并不需要非常高的理论水平”。 不过,一些研究人员仍然希望从几何学角度来证明GCI。罗恩的分析证明实际上使凸几何学中出现了一些令人匪夷所思的新现象,而通过几何学的证明途径,这些现象或许才可以得到解释。皮特还指出,GCI定义了重叠凸多边形表面向量之间的有趣关系,这有望发展成凸几何学中一个新兴的子领域。“至少现在我们知道,(这种向量之间的关系)是成立的。”不过,“如果能从几何学角度理解GCI,我们就能解开现存的一类难题。” 除了对几何学产生的影响之外,理查兹说,GCI的一个变体或许有利于一些统计预测,比如预测股价等变量在一段时间内的波动区间。在概率论中,鉴于GCI已被证明,人们就可以运用在“小球”概率中(与粒子在流体中的随机运动路径有关),用GCI来计算确切速率。理查兹说,他已经基于GCI,提出了几个新的不等式猜想,可能会用罗恩的方法试加证明。 罗恩的关注点主要在于改进统计测试中一些常用公式的计算方式。举个例子,统计学家需要基于几个变量的测量值——如病人反应时间和身体晃动程度,以确定一种药物会不会引发疲劳。他说,拓展后的GCI确实能改进医药领域的统计工具。最近,他的另一些GCI相关研究也带来了现实中的改进。 GCI猜想得到证明后,并没有引起轰动,但罗恩倒不是特别失望或诧异。“我经常被德国顶尖大学的科学家们无视,已经习惯了。”他在电子邮件中写道。“我并不是很擅长利用人脉。我的生活质量不需要这些东西来维持。” 能够证明一个重要猜想,这件事本身就让罗恩产生了“深刻的喜悦和感激之情”,他觉得这就已经足够。“它就好像某种恩赐。”他说,“我们可能在一个问题上费了很长时间,突然有一天,神经元的神秘运作就像天使一般,带来一个绝妙的点子。” 选自:http://www.toutiao.com/i6413579865114542593/
发表评论 取消回复