报道：数学证明到底是什么？丨展卷

数学史家，穆伦堡学院名誉Truman Koehler数学教授威廉·邓纳姆在1994年出版The Mathematical Universe一书，用26个英文字母作为标题讲述数学史上重要的问题和人物。本文选自J——Justification，论证。数学与其他学科最大的不同就在于，命题需要证明。数千年来数学正因为此发展进步，人类一步步攀上智慧的高峰。而且，在作者看来，“数学证明的标准不同于其他任何人类活动领域中的标准。“那么，数学定理的证明到底是什么呢？本文给出了四个基本原则，阐述涉及数学证明本质的非常有意义的问题。

本文经授权选自《数学那些事：伟大的问题与非凡的人》（图灵｜人民邮电出版，2022.3），标题为编者所加。

撰文丨威廉·邓纳姆（William Dunham，美国穆伦堡学院数学教授）

(资料图)

翻译丨冯速

“证明，”数学家迈克尔·阿蒂亚（Michael Atiyah，1929-2019）曾说，“它是胶水，把数学粘到了一起。”显然，这一观点想说的是，证明或者说论证是数学的化身。

这样的观点可能会引起争议。数学这个学科涉及的范围如此广泛，它可以包含各种活动，如估值、构造反例、测试特殊案例以及解决日常问题等。数学家也不必每天24小时都在证明定理。

然而，即便理论命题的逻辑论证不是数学的全部活动，它也肯定是这个学科的特征。数学离不开其他各个方面的学术努力，就像它离不开证明、推理以及逻辑演绎一样。在比较数学与逻辑的关系时，伯特兰·罗素断言：“已经无法在二者之间划出界线了；事实上，二者是一体的。”

本书已经分析了很多数学论证。在第 A 章（Arithmetic 算术）中，我们证明了质数的无穷性；在第 H 章中，我们证明了毕达哥拉斯定理。就一般数学论证而言，这些证明相当简单。其他论证却需要很多页、很多章节，甚至很多卷才能得出它们的最终结论。相应的智力要求不见得适合每一个人，正如谦逊的查尔斯·达尔文表明的那样：“我跟随漫长而纯粹抽象的思维轨迹的能力极其有限，因此我从来不可能在形而上学或者数学上取得成功。”或者，用约翰·洛克（John Locke）更简短的话说：“数学证明像钻石一样既坚硬又清透。”

数学定理的证明到底是什么呢？这个问题并不像它看起来那样一目了然，因为它涉及哲学、心理学和数学各方面的因素。亚里士多德对此有深刻的理解，他把证明描述为“不是表面上的陈述而是内心的冥想。”

罗素也做出了令人信服的评论：数学家永远不可能把“完整的推理过程”写到纸上，而一定会放置“足以使训练有素的大脑信服的证明摘要”。他想要说的就是，任何数学陈述都是建立在另一些陈述和定义的基础之上的，这些陈述和定义又是建立在更多的陈述和定义的基础之上的，因此要求证明沿着每一个逻辑步骤追踪回来，也许有点鲁莽。然而在 20 世纪初，当罗素与艾尔弗雷德·诺思·怀特海（Alfred North Whitehead，1861-1947）一起合著巨著《数学原理》时，他似乎忘记了自己给世人的忠告。在这本著作中，他们尝试着把整个数学回推到基础的逻辑原理，并在这一过程中保留了细节。其结果是非常折磨人的。他们的展开如此周密，在他们最终证明了 1+1=2 之前，此书已达 362 页，这一证明在“基数算术导言”一章的 54.43 节（参见图1）。《数学原理》使论证变得疯狂。

图 1 罗素和怀特海证明1+1=2丨摘自艾尔弗雷德·诺思·怀特海和伯特兰·罗素于 1910 年合写的《数学原理》的第 1 卷。剑桥大学出版社惠允

在本章，我们要试着保持头脑清醒。按照我们的意思，证明就是在逻辑法则的范围内精心制作的推理，对于一个论断的正确性，它无懈可击，令人信服。像“说服谁？”或者“按照谁的标准无懈可击？”等一类问题留作以后再议。

当然，我们也可以选择考虑什么不是证明。借助直观、常识，或者更糟，借助暗示的陈述都不是论证。刑事诉讼中作为有罪证明的“排除一切怀疑”的证明，也不是我们所说的论证。数学家认为，证明不仅能排除合理的疑问，而且能够排除所有疑问。

我们可以从许多不同的方向展开关于数学论证的讨论。这里，我们给出四个重要的基本原则，并逐个阐述涉及数学证明本质的非常有意义的问题。

基本原则#1：个案不充分

无论在科学中，还是在日常生活中，当实验反复肯定某个原则之后，我们就倾向于接受它的真实性。如果肯定的案例数量足够大，我们就说有了一个“被证实的法则”。

但是，对于数学家来说，几个案例的结果尽管可能给出一些提示，但绝不是证明。下面给出这种现象的一个例子，考虑

这是真的吗？显然，我们可以代入几个正整数看一看有什么结果。当 n=1 时，我们得到f(1)=1-28+322-1960+6769-13132+13069-5040=2，显然断言成立。如果我们代入n=2，计算结果为

f(2)=27-28×26+322×25-1960×24+6769×23-13132×22+13069×2-5040=2

这一次断言仍然成立。我们希望读者拿出计算器，验证一下f(3)=3，f(4)=4，f(5)=5，f(6)=6，甚至f(7)=7。

这个论断的证据似乎建立起来了。有些人，特别是那些对这样机械式的计算没有热情的人也许已经宣布这个陈述是真的。但是，它不是真的。代入 n=8 时，我们得到

结果不是我们期望的 8。进一步的计算表明f(9)=40329，f(10)=181450，f(11)=640811，所以此断言不仅失败了，而且错得惊人。对于由n=1, 2, 3, 4, 5, 6, 7时都为真得出 n 为任意正整数时都为真的猜测实际上是不正确的。

我们把下面这个表达式展开并合并同类项，就可以得到刚才讨论的多项式

f(n)=n+[(n-1)(n-2)(n-3)(n-4)(n-5)(n-6)(n-7)]

显然，对于n=1，项(n-1)为零，因此方括号中的所有乘积都为零；因此f(1)=1+0=1。如果n=2，那么n-2=0，所以f(2)=2+0=2。类似地，f(3)=3+0=3，一直到f(7)=7+0=7。但是这之后括号里的项不再是零，例如f(8)=8+7!=5048。

这引出下面这样一个富有挑战性的扩展命题。假设我们引入

g(n)=n+[(n-1)(n-2)(n-3)…(n-1000000)]

并猜测对于所有正整数n，有g(n)=n 。

我们做乘法且合并g(n)的项，就得到一个一百万次的惊人方程。通过与上面完全相同的推理，我们将发现g(1)=1 ，g(2)=2，一直到g(1000000)=1000000。

在发现了一百万个连续正确的证据之后，任何思维正常的人都会怀疑g(n)是否总是产生n。对于任何人——除了数学家之外，一百万次连续成功都等同于排除了所有值得怀疑的证明。然而，再接下来验证一下，g(1000001)实际上等于1000001+1000000! ，这个数非常大，显然超过 1 000 001。

上面这个例子强调了关于数学证明的第一个基本原则：我们必须对所有可能的情况进行证明，而不仅是对几百万个情况进行证明。

基本原则#2：越简单越好

数学家赞美那些巧妙的证明。但是，数学家更赞美那些既巧妙又经济的证明，即那些直击要害、直达目标的没有多余之处的简洁推理。这样的证明被认为是优雅的。

数学的优雅与其他创意作品的优雅没有什么不同。它与莫奈的油画艺术的优雅有很多共同之处，仅用寥寥几笔勾勒或几行诗描绘的法国乡村风景，胜过长篇大论。优雅在本质上属于美学范畴，而不是数学的特性。

同任何理想一样，优雅不是总能够实现的。数学家们为简短、清晰明了的证明而奋斗，但是经常必须忍受令人讨厌的烦琐事物。例如，抽象代数中有限单群分类的证明用了 5000 多页纸（最终检验通过时）。寻求优雅的人请另寻出路。

相比之下，数学家达到的终极优雅是所谓的“无言的证明”，在这样的证明中一个极好的令人信服的图示就传达了证明，甚至不需要任何解释。很难比它更优雅了。例如，考虑下面的例子。

但是第一个基本原则警告说，只有傻子才会依据一个案例就匆匆得出结论。我们要利用图2 去证明这个命题。

图2

这里我们采用由一块加上两块再加上三块等这样阶梯式的结构，如图2阴影部分所示；用方块摆出n×(n+1)的矩形排列。这个矩形是由两个完全相图同的阶梯组成的，矩形的面积等于它的长和宽的积，即n×(n+1) ，因此这个阶梯的面积一定是矩形面积的一半，即

证毕。

读者也许观察到这个“无言的证明”仍然伴随着一段文字解释。但是，语言的解释的确没有必要，这个图示值千言万语。（“无言的证明”是美国《大学数学杂志》的固定专栏。）

下面是另一个不可否认的优雅证明。假设我们从 1 开始把正奇数依次相加：

1+3+5+7+9+11+13+…

一些经验提示我们，无论把这个加法进行到什么时候，其结果总是完全平方数。例如，

这永远为真吗？如果是，我们如何证明这个一般结果？

下面的推理需要一点代数知识，根据观察：偶数是 2 的倍数，因此对某个整数n，其形式是2n ；而奇数比 2 的倍数少 1，因此对某个整数n，其形式是2n-1。

定理从 1 开始的连续奇数之和是一个完全平方。

证明设 S 是从 1 开始到2n-1(n＞0)的连续奇数之和，即

S=1+3+5+7+…+(2n-1)

显然我们可以求从 1 到 2n 为止的所有整数的和，然后再减去偶数之和就可以得到连续奇数之和。换句话说

S=[1+2+3+4+5+…+(2n-1)+2n]-(2+4+6+8+…+2n)

=[1+2+3+4+5+…+(2n-1)+2n]-2(1+2+3+4+…+n)

这里，我们从第二个方括号的表达式中提出了一个因子 2。

第一个方括号中是从 1 到 2n 的所有整数的和，而第二个方括号中是从 1 到 n 的所有整数的和。图2的“无言的证明”展示了如何求这样的整数和，所以我们两次利用那个结果：

化简上式得到

一句话，这个证明是优雅的。但是，如果它是我们寻找的那种优雅，那么图3则给出了另一个更短的证明，一个无言的证明。这里奇数是一个方块、三个方块、五个方块，以此类推，按特殊方法排列。我们从左下角的一个方块开始，三个有阴影的方块包围着它形成一个2×2 的正方形，五个没阴影的方块包围着前面这些方块形成一个 3×3 的正方形，接下来就是七个有阴影的方块包围着前面这些方块形成一个 4×4 的正方形，以此类推。这张图示清楚地表明从 1 开始的连续奇数的和总是产生一个（几何的）平方。这个证明非常自然。早在 2000 年前古希腊人就知道它了，现代的后辈可以通过构建方块模仿这一证明。

图3

温斯顿·丘吉尔（Winston Churchill）说：“短小的词为佳，而既古老又短小的词为最佳。”我们可以重新描述这个优雅推理：古老的证明为佳，而既古老又短小的证明为最佳。

基本原则#3：反例的价值

数学中有一个非常严酷的现实：为了证明一个一般的陈述需要一个一般的推理；但为了反驳它，只需要一个特殊的例子，一个使这个陈述失败的例子。后者称为反例，一个好的反例价值如金。例如，假设我们有下面的猜测。

我们强调，尽管可能需要 50 页纸的推理来证明一个定理，但是只要一行反例就可以反驳它。在证明和反证之间的大战中，似乎没有一个公平的竞争环境。但是，还是要说一句警告的话：寻找反例不像看起来那样容易。下面的故事就是一个例子。

两个多世纪前，欧拉猜测至少要把三个完全立方加起来才能得到另一个完全立方，至少要把四个完全四次幂相加才能得到另一个完全四次幂，至少要把五个完全五次幂相加才能得到另一个完全五次幂，等等。

读过第 F 章的读者应该意识到，这是费马最后定理的特殊情况 (n=3)。

提高次数，我们能够找到四个完全四次幂，它们之和等于一个四次幂。例如，考虑下面绝非一目了然的例子：

欧拉猜测三个四次幂之和不会产生另一个四次幂，但是没有给出证明。一般地，他说至少需要n个n次幂，使得它们之和等于另一个n次幂。

这件事在 1778 年成立，近两个世纪后它仍然成立。信任欧拉的人不能用证明来肯定欧拉的猜测，但不相信欧拉的人也不能构造出一个特殊的反例来驳倒它。这个问题是一个未解问题。

到了 1966 年，数学家利昂·兰德（Leon Lander）和托马斯·帕金（Thomas Parkin）发现了下面这个例子：

这表明三个四次幂，而不是欧拉说的四个四次幂，也能生成一个四次幂。

寻找这些反例需要大量努力，甚至动用了计算机的力量，这是非常惊人的。这显然给出了基本原则 #3 的一个推论：有时候反证比证明更难。

基本原则#4：可以证明否定

在理发店或快餐店里，我们经常听到这样一句老话：你不能证明否定。它可能是由下面这样的对话引发的：

A：“超市小报说一个小妖精中了奖。”

B：“没有小妖精这种东西。”

A：“你说什么呢？”

B：“我说小妖精不存在。”

A：“你肯定吗？你能够证明它不存在吗？”

B：“当然……不能。但是你也不能证明它存在。”

这个对话很长。用一句话说，它声称我们绝对不能证明小妖精不存在。

数学家知道得更清楚。一些最伟大、最重要的数学推理所论证的就是某些数、某些形状、某些几何结构不存在且不可能存在。人们使用最猛烈的武器，即理性的、严密的逻辑确立了这些不存在的事物。

认为否定不可证明的这种普遍观念本质上是错误的。为了证明小妖精不存在，我们似乎需要翻遍爱尔兰岛上的每一块石头，翻遍南极洲的每一座冰山。当然这是不可能实现的野心。

为了在逻辑上确立不存在的事物，数学家采用了一种非常不同然而又非常完美的策略：假设这个对象的确存在，然后再追踪由此产生的结果。如果我们能够证明存在的假设将导致一个矛盾的话，那么逻辑法则允许我们得出结论：我们在第一步中所做的存在的假设是错误的。因此，我们就能够得出这个事物不存在的毫无争议的结论，同时也说明一个事实，即我们采用了一个非直接的途径所得到的这个结果是正确的。

在第 Q 章中，我们将讨论最著名的不存在证明：为什么不存在等于

的分数？然而，对于我们眼前的目标，下面这个例子就足够了。

定理不存在边长分别为 2, 3, 4, 10 的四边形。

处理这个问题的一个实用方法是截出这些长度的木棍，然后试着把它们摆放成一个有四条边的图形。这只是一个说明，然而在逻辑的意义下，这相当于要在某块岩石下找到一个小妖精。即使我们花费了好多年都没有成功地用这四根木棍摆出一个四边形，也不能排除也许某个人在某天成功地把它们摆成四边形的可能性。

合理的方法是我们要间接地证明一个否定。开始我们假设存在一个四边形，它的边长分别是 2, 3, 4, 10，然后再设法生成一个矛盾，这是一个战略上的飞跃。

我们假设的四边形如图4 所示。画出虚线所示的对角线，它把这个四边形分成两个三角形，并设是这条对角线的长度。第 G 章（古希腊几何）已经说明过，欧几里得证明了三角形的任意一条边小于其他两条边的和。因此在△ABC 中，我们知道10＜4+x。同样在△ADC 中，有x＜2+3。把这两个不等式结合起来得到

10＜4+x＜4+(2+3)=9

根据上面的不等式，得到10＜9。这是不可能的。我们最初所做的存在这种特殊的四边形的假设导出了这一矛盾，所以说我们的假设是无效的。

这个四边形的四条边长的出现顺序（按顺时针）是 10, 2, 3, 4。还有其他方法放置这四条边，如图5所示，同样的推理也导出一个矛盾。此时是10＜2+x＜2+(3+4)=9 。这是不可能的。

图4和图5

没有必要再继续寻找了，重新布局再多次也是没有意义的。这样的四边形是不可能存在的。我们最终证明了一个否定。

基于矛盾的证明是一个非常好的逻辑策略。假设我们想要证明的反面是成立的，我们似乎是在毁灭自己的目标。但是，最后我们避开了灾难。哈代把基于矛盾的证明描述为“数学家最好的武器之一。它远比其他任何先手棋策略好得多：象棋手也许要牺牲一个小卒或者其他一枚棋子，但是数学家牺牲的却是整盘游戏“。

问题：还需要人类吗？

大约在 20 世纪 70 年代到 80 年代期间，有一种令人不安的映像闯入数学家的意识之中。这就是计算机映像，它以光一样的速度和实质上的可靠性接手了证明定理的工作。

令整个数学界感到困惑的是此后出现的一些利用计算机来证明定理的情况。这些情况往往把一个定理分解成很多子情况，假如肯定了每一种子情况，那么就可以断定解决了整个问题。遗憾的是，这种分析通常需要考虑上百种情况，需要成千上万次计算，而人类没有可能重复所有步骤。总之，这样的证明只能通过其他机器来检查。

1976 年，计算机证明凭借解决四色猜想问题戏剧般地登上了数学舞台。所谓的四色猜想，是任何画在平面的地图都可以用四种（或少于四种）颜色着色，使得拥有共同边界的任意两个区域都被涂上不同的颜色。（例如在图6中，我们不想给区域 A 和 B 都涂上红色，因为那样一来它们的公共边界线会被遮住。我们允许给相交于一点的两个区域，如区域 A 和 C 涂上相同的颜色，当然一个点不是边界线。）

四色猜想诞生于 1852 年，在接下来的一个世纪里引起了广泛的关注。有几个问题很快就被解决了，比如任何平面地图肯定可以用五种颜色着色，还有就是用三种颜色着色地图是不充分的。图 7就给出了这样的一个地图。在这张图上，我们必须使区域 A、B 和 C 有不同的颜色，因为它们每对都有共同的边界，但是接下来，除非使用第四种颜色，否则不可能给区域 D 着色。

因此，五种颜色（可能）太多而三种颜色又不够。显然这就需要四种颜色。四种颜色足以给任何平面地图着色吗？

我们之前的讨论表明，要想解决这个问题只有两种选择：要么提出一个特殊的反例，即给出一种不能用四种颜色着色的特殊地图；要么设计一个一般的证明，证明任何地图都能够这样着色。对于数学家来说，这个反例很难找到。他们制作的每一张地图无论多么错综复杂，都能仅用红色、黄色、蓝色和绿色着色。（有蜡笔的读者也许想立即勾画出一张地图，然后尝试一下。）

图6和图7

但是，正如我们反复提醒的那样，证明可不光是找到几个反例就算完成了。以前人们会发疯地寻找一般推理，但事实证明每一种情况都与寻找反例一样困难。局势处于停顿的状态。

后来，美国伊利诺伊大学的阿佩尔（Kenneth Appel）与哈肯（Wolfgang Haken）宣布四色猜想为真，震撼了整个数学界。令人们感到震惊的不是这个结论，而是他们的证明技术：计算机完成了证明中最艰难的部分。

阿佩尔和哈肯处理这个问题的方法是，把所有平面地图分成某些类型，然后分别分析每一种类型。遗憾的是，一共有上百种类型需要检查，每一种类型都给高速计算机带来大量的工作。最后，计算机宣告这个猜测是真的，即所有可能的类型都可以用四种颜色着色。这个定理得到了证明。

这是真的吗？说句公道话，当时一种不安的情绪在整个数学界蔓延。这算得上是一个正确的论证吗？令人困惑的是，回答这个问题需要一个真正的有血有肉的人每周工作 60 小时，花费大约 100 000 年的时间去检查计算机的计算。甚至是最健康、最乐观的人也不可能活那么长时间，总之，谁愿意花这个工夫呢？

如果程序出现了错误怎么办？如果功率突增使得计算机跳过关键的步骤怎么办？如果计算机的硬件设计暴露出极少见的微小缺陷怎么办？总之，我们能够相信机器大脑能给我们真理吗？正如数学家罗恩· 格雷厄姆（Ron Graham）在考虑这些复杂问题时提出的那样：“实质的问题是这样的：如果没有人能够检查一个证明，它还是一个真正的证明吗？”

直到今天，这个问题也没有明确的答案，尽管随着计算机证明变得更加普遍，也许数学家们对它们的出现会感到稍舒服些，但是，公正地说，如果四色定理拥有写了两页纸那样短小、睿智而优雅的证明，而不是依靠计算机的蛮力得到的证明，那么大多数数学家也许会轻松地喘口气。传统主义者希望古老的数学不要被接上电源。

“还需要人类吗？”此时这个问题的答案仍然是“需要”。毕竟得有人打开空调吧。但是我们得承认这个观点也许是有偏见的，因为它的支持者本身是人。

我们关于数学论证的讨论到此就结束了。显然，还有很多话要说，也应该引出其他的议题，应该提出其他的基本原则。但是，我们最终得出的最重要的结论是：无论是优雅还是麻烦，是直接还是间接，是依赖于计算机还是人力，数学证明的标准不同于其他任何人类活动领域中的标准。

前往“返朴”公众号，点击下图或左下角“阅读原文“购买↓↓

特别提示

1. 进入『返朴』微信公众号底部菜单“精品专栏“，可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号，回复四位数组成的年份+月份，如“1903”，可获取2019年3月的文章索引，以此类推。

版权说明：欢迎个人转发，任何形式的媒体或机构未经授权，不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。

关键词：基本原则这个问题连续奇数

责任编辑：Rex_02