之前聊了几个博弈论的悖论问题,这次来说一个博弈论中的经典定理——策梅洛定理(Zermelo’s Theorem)。这个定理听起来有点抽象,但它对我们理解棋类游戏有很深的启示。
1. 定理内容
策梅洛定理由德国数学家恩斯特·策梅洛在 1913 年提出,简单来说就是:
在双人、零和、完全信息、有限步的博弈中,必然存在一种最优策略,使得先手方或者后手方必胜,或者双方必然和局。
换句话说,对于围棋、国际象棋、井字棋这类游戏,理论上一定存在一个「正确答案」,只是我们还没找到。
2. 定理条件解释
让我解释一下定理中的几个关键条件:
| 条件 | 说明 | 例子 |
|---|---|---|
| 双人博弈 | 只有两个玩家 | 围棋、象棋 ✓ |
| 零和博弈 | 一方收益=另一方损失 | 棋类都是 ✓ |
| 完全信息 | 双方能看到所有信息 | 围棋 ✓,扑克 ✗ |
| 有限步 | 游戏必定结束 | 围棋 ✓(禁全局同形) |
围棋、国际象棋、中国象棋、井字棋都满足这些条件。
3. 定理的证明思路
证明方法主要是逆向归纳法(Backward Induction):
3.1 逆向归纳步骤
- 从游戏的终局开始考虑
- 对于每一个局面,判断当前玩家会选择哪一步
- 逐步向前推导,直到初始局面
3.2 以井字棋为例
- 终局只有三种结果:先手胜、后手胜、和局
- 从所有可能的三步终局反推两步的局面
- 再从两步反推一步
- 最终确定先手的最优策略
对于井字棋,结论是:双方都采取最优策略时,必然和局。
4. 对棋类游戏的启示
策梅洛定理告诉我们一个有点「残酷」的事实:
围棋和国际象棋这样的游戏,理论上已经被「破解」了。
也就是说,存在一个最优策略,可以保证某一方不败。只是这个策略太复杂,人类(甚至目前的计算机)还找不到。
4.1 井字棋:已被破解
井字棋太简单了,所有可能的状态只有 3^9 = 19683 种(实际有效状态更少)。最优策略已经被完全掌握,两个高手对弈必然和局。
4.2 国际象棋:部分破解
国际象棋的状态数大约是 10^44 种。虽然远超井字棋,但目前的超级计算机已经能计算出很多「残局库」。
对于某些特定的残局(比如王+后对王),最优策略已经完全确定。但完整棋局的最优策略还没找到,所以职业棋手仍然有存在的意义。
4.3 围棋:最难破解
围棋的状态数大约是 10^170 种,比宇宙中的原子数还多。
长期以来,人们认为计算机不可能在围棋上战胜人类。但 2016 年 AlphaGo 的出现改变了这一切。
虽然 AlphaGo 没有找到「最优策略」,但它找到了比人类更强的策略。现在,职业棋手已经无法战胜顶级 AI。
5. 游戏复杂度对比
| 游戏 | 状态数 | 是否破解 |
|---|---|---|
| 井字棋 | ~10^3 | ✅ 完全破解 |
| 国际跳棋 | ~10^20 | ✅ 完全破解(2007年) |
| 国际象棋 | ~10^44 | 🔶 部分破解 |
| 围棋 | ~10^170 | ❌ 未破解 |
6. 一个有趣的推论
策梅洛定理有一个有趣的推论:
如果围棋已经被「破解」,那围棋比赛是不是就没有意义了?
答案是否定的,因为:
- 我们还没找到最优策略
- 即使找到了,人类棋手之间的博弈仍然精彩——就像百米赛跑,世界纪录是确定的,但比赛依然有意义
- 围棋的美感不仅在于胜负,还在于过程中的思考和创造
7. 小结
策梅洛定理告诉我们,在很多棋类游戏中,「正确答案」是存在的。但这并不意味着这些游戏失去了意义——寻找答案的过程本身,就是游戏的魅力所在。
关键要点:
- 策梅洛定理:特定条件下博弈必有最优解
- 逆向归纳:从终局反推最优策略
- 游戏复杂度:决定了「破解」的难度
而且,定理只适用于满足特定条件的博弈。像扑克、麻将这类有隐藏信息的游戏,或者电子游戏中不完全信息的场景,定理就不适用了。
这就是数学和游戏的有趣之处:有些问题有确定的答案,但找到答案的过程才是最精彩的。
如果你想深入了解策梅洛定理的数学证明,可以参考博弈论的相关教材,或者搜索「Zermelo’s theorem proof」。