银河帝国与控制论、博弈论和机器学习

Ke Gao

2017-07-30 (Updated: 2023-04-17)

受我家科幻迷的影响，最近开始读阿西莫夫的《银河帝国》的“基地系列”。本文是对银河帝国与控制论、博弈论和机器学习的胡思乱想。

谁是阿西莫夫？啥是“基地系列”？

对于科幻迷来说阿西莫夫是神级的存在（是的，大刘也没法跟他比），维基百科是这么介绍他和《银河帝国》的：

艾萨克·阿西莫夫（Isaac Asimov，生名：伊萨克·尤多维奇·奥济莫夫，Исаак Ю́дович Ози́мов，1920年1月2日－1992年4月6日），出生于俄罗斯的美籍犹太人作家与生物化学教授，门萨学会会员，他创作力丰沛，产量惊人，作品以科幻小说和科普丛书最为人称道。美国科幻小说黄金时代的代表人物之一。

阿西莫夫一生创作和编辑过的书籍超过500册，据估计他至少写过9000封的信函和明信片，著作类别除了哲学类以外，几乎涵盖整个“杜威十进制图书分类法”[1]。阿西莫夫是公认的科幻大师，与儒勒·凡尔纳、H·G·威尔斯并称为科幻历史上的三巨头，同时还与罗伯特·海因莱因、亚瑟·克拉克并列为科幻小说的三巨头。[2]阿西莫夫的作品中，以“基地系列”最为人称道，其它的主要著作还有“银河帝国三部曲”和“机器人系列”，三大系列最后在“基地系列”的架空宇宙中合归一统，被誉为“科幻圣经”。

整套丛书共 15 册，前七部是“基地系列”，中间五部是“机器人系列”，最后三部是“银河帝国系列”，而我现在看到《银河帝国5：迈向基地》，所以本文并非读后感，而是“读中感”。

同时，我目前在读《控制论与科学方法论》，看博弈论，学习机器学习。当然，三者也全都未完成哈哈。但是我却很惊喜地发现，我读的这系列最“没用”的科幻小说，竟然是以控制论、博弈论、机器学习为框架构建的。值得注意的是，基地系列小说最早发表于 1942 年，而标志着现代系统博弈理论初步形成的《博弈论与经济行为》，最早出版于 1944 年。

首先，“基地系列”讲了一个什么故事？

随着人类科技发展，银河系形成了一个庞大的帝国，从银河每条巨大旋臂此端至彼端，其间数百万个世界，皆为帝国的势力范围，史称“第一银河帝国”。

但第一银河帝国正在衰亡之中。这个衰败与崩溃的过程已经进行了数个世纪，却仅有一人全盘了解这个事实。他就是哈里・谢顿，第一帝国最后一位伟大的科学家。

为了阻止帝国的衰落甚至覆亡，哈里・谢顿发展出了心理史学这门科学。心理史学在他手中发展至登峰造极之境，从此，人类行为得以简化为数学方程式。个体的行为虽然无从预测，但是谢顿发现，人类群体的反应却能以统计方式处理。群体的数目愈大，预测就能愈为精确。而谢顿所研究的群体，则是银河中数千万住人世界的人口总和。

谢顿根据自己的方程式，预测到第一帝国的覆亡无法阻止，而人类要经历三万年悲惨痛苦的岁月，第二帝国才会自废墟中崛起。但是，若能修正某些现有的历史条件，三万年的“大断层”或可减至仅仅一个仟年。

为了达到这个目的，谢顿建立了两个科学根据地，命名为第一基地与第二基地，并故意将两者设在“银河中两个遥相对峙的端点”。其中，专注于物理科学的第一基地，一切发展过程完全公开，而由心理史学家与精神科学家组成的第二基地，则几乎没有留下任何线索。

第一基地（一般都简称基地，因为第二基地始终鲜为人知）最初只是一个小型社群，在银河外缘虚无的太空中渐渐为人遗忘。周期性的危机一个接一个冲击这个基地，各个危机都蕴涵着当时人类活动的各种变数。它的行动自由被限定在特定轨迹上，只要沿着这条轨迹不断前进，必有柳暗花明的发展。这一切，都是早已作古的哈里・谢顿当年所规划的。

第一基地设在端点星，该行星位于银河系某个旋臂的尽头。起初，它是一群科学家的殖民地（阿西莫夫本身是科学家，他 YY 一下也不过分哈哈）。他们远离了帝国的动荡社会，以编纂一套汇集天地间所有知识的巨著《银河百科全书》，却不知道自己扮演着更具深意的角色，而这一切，都是已故的谢顿一手计划的。

后来，随着帝国逐渐瓦解，银河外围区域纷纷独立称王，基地开始遭受这些王国的威胁。然而，在首任市长塞佛・哈定领导下，基地设法让这些小小“君主”彼此牵制，而能勉强维持一个独立的局面。由于其他世界科学中落，退化到石油与煤炭的时代，唯独基地拥有核能，因此享有难得的优势。最后，基地竟然成为邻近诸王国的“宗教”中心。

随着百科全书的任务退居幕后，基地慢慢开始发展贸易体系。基地所研发的核能装置，小巧程度远超过帝国全盛时期的工艺水准。负责推销这些商品的基地行商，足迹遍至银河外缘数百光年。侯伯・马洛是基地第一位商业王侯，在他的领导下，基地发展出经济战，并藉此击败科瑞尔共和国。该国虽有帝国外缘某个星省的援助，最后仍然无条件投降。

两百年后，基地俨然成为银河系中最强大的政权，只有苟延残喘的帝国能抗衡之。此时，帝国的主体集中于银河内围三分之一处，却仍然控制着全银河四分之三的人口与财富。

然而心理史学是一门统计性科学，某个环节出差错的机会在所难免。而接下来的变故，连哈里・谢顿都未曾预见。一个自称为骡的人无端崛起，他拥有银河中独一无二的精神力量，能够随意调整人类的情感，重塑他人的心灵。即使最强硬的死敌，也会被他改造成最忠诚的奴仆。任何军队都不能与他为敌。第一基地终于难逃一劫，谢顿计划眼看就要成为历史的灰烬。

此时，只剩下神秘的第二基地是唯一的希望（由心理学家组成）。由于骡的出现太过突然，第二基地措手不及，只好着手策划长期的反攻计划。第二基地最大的防御力，就在于下落不为人知。为了完成征服银河的壮举，骡势必要将它寻获。流亡在外的第一基地志士，也在尽力找寻它的下落，冀望它伸出援手。结果双方都无功而返。骡的第一波搜索行动，被一个平凡的女子贝泰・达瑞尔所阻止。这正好为第二基地争取到充分的时间，筹划出一个天衣无缝的行动，终于彻底遏止骡的野心。他们的下一个任务，则是要将谢顿计划慢慢导回正轨。

但是，第二基地可说因此曝了光。第一基地获悉了第二基地的存在，却不希望自己的未来被那群精神学家监管。第一基地的有形武力强大绝伦，而第二基地除了要化解武力的威胁，还要尽快完成一项双重的任务：令第一基地放弃寻找，并让自己再度隐身幕后。在有史以来最伟大的“第一发言者”普芮姆・帕佛领导之下，第二基地顺利完成这些使命。他让第一基地自以为大获全胜，自以为消灭了第二基地。从此之后，第一基地致力发展横扫银河的势力，完全不知道第二基地依旧存在。如今，第一基地已经屹立四百九十八年，势力处于巅峰状态。

后面的故事我就不知道了，毕竟，我还没看完嘛，不过上面叙述的故事已经可以说是非常宏大了。

这部小说是怎么与控制论扯上关系的？

哈里·谢顿运用他的心理史学，发现第一帝国的覆亡无法避免后，于是决定修改某些历史条件（建立基地），实现第一帝国向第二帝国快速地过渡，就是控制论的思。《控制论与科学方法论》中讲，人们根据自己的目的，改变条件，使事物沿着可能性空间内某种确定的方向发展，就形成控制。控制，归根结底是一个在事物可能性空间中进行有方向的选择的过程。

什么又是可能性空间？我们将事物发现变化中面临的各种可能性集合成为这个事物的可能性空间，这是控制论中最基本的概念。被控制对象必须存在多种发展的可能性，而且人可以在这些可能性中通过一定手段进行选择，才谈得上控制。

控制过程都是由三个基本环节构成：

了解事物面临的可能性空间是什么。在银河帝国中，谢顿认识到第一帝国的覆亡不可避免，但人类经过多长的混沌过渡期，才能走向怎样的一个银河第二帝国，这都是不确定的，是“心理史学”发挥作用的可能性空间。
在可能性空间中选择某一状态为目标。谢顿的目标是尽可能缩短过渡期“大断层”的时间，建立一个更稳定繁荣的第二帝国。
控制条件，使事物向既定的目标转化。在小说里的体现，就是谢顿设立了第一基地和第二基地啦。

基地系列中哪里出现了博弈论？

小说中对于博弈论的体现，主要体现在第一基地在第一次面临“谢顿危机”时，基地市长塞佛·哈定运用合作博弈制衡了周围四个王国，不仅避免了基地覆灭，还顺势建立“科学教”，使基地更加强盛。

基地纪元79年，由于帝国式微，与端点星相邻的四郡县纷纷反叛独立，其中最强大的安纳克瑞昂王国对基地所拥有的科学知识与核技术虎视眈眈，并切断了端点星与帝国的联系。基地市长塞佛·哈定遂出访其他三个王国进行外交斡旋，鼓吹如果这三个王国放任安纳克瑞昂侵占端点星，将会使之形成独霸局面，未来势必会威胁到这三个国家的自身存亡。此后，这三个王国迫使安纳克瑞昂撤军。

塞佛·哈定接着向四个王国提供科学与医疗援助，以求降低四国联合侵犯端点星的可能性。然而四王国由于科学技术水平远远落后于基地，其人民将基地提供的技术援助视为魔法。端点星外派的科技援助人员无法劝说当地民将科学区别于魔法，遂将计就计，逐渐将自己伪装为魔法师或圣人，接受当地人民的膜拜。而塞佛·哈定也接受了这个事实，于是将科技援助计划伪装成一个有组织的宗教团体，将科学语言转换为宗教教义，并建立了一套宗教礼仪体系，派驻各地的科技援助人员摇身变为了神职人员。

合作博弈论是博弈论中的一种理论，是指一些参与者以形成联盟、互相合作的方式所进行的博弈。这样一来博弈活动就变成了不同集团之间的对抗。在合作博弈中，参与者未必会做出合作行为，会有一个来自外部的机构（第一基地）用不同方式惩罚非合作者。

基地系列竟然和当下火热的机器学习有关？

哈里·谢顿之所以能够预测第一帝国的覆灭，并着手建立两个基地，更快地过渡到第二帝国，靠的就是他一手发展起来的心理史学。

要注意的是，小说中的心理史学与现实中弗洛伊德发展的心理史学完全是两个概念。

阿西莫夫借鉴了热力学的理论：在多粒子系统中，单个粒子的运动无法描述，但是大量粒子的运动是可以很精确的描述的。

阿西莫夫将这个概念应用到银河帝国上，其人口以百兆计，达到了统计学的数量级。预测一个人或者少数人的未来是没有可能的，但是对于如此数量级的人类社会动向就完全可以通过统计科学的计算而预知到，可知道未来的各国经济、国界、兵力、人口数、事件、科技、资源、人的思考。

在我看来，如果哈里·谢顿，或者说阿西莫夫的心理史学能够实现，其方法一定是机器学习。因为心理史学的理论和条件，太适合用机器学习来处理了。

机器学习这个词儿，可能经常听，但具体是什么，我们很多人可能并不清楚。机器学习（ML）是人工智能（AI）的一个分支，也是人工智能的一个实现途径。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。这些算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。

说白了，就是输入大数据 + 算法，让计算机输出规律和预测。在心理史学中，大数据就是银河帝国的千百万个世界中人类的历史和行为记录；算法也难不倒谢顿，毕竟他是个数学家呀。但我想，谢顿用的算法，应该不是决策树、支持向量机、贝叶斯、K-均值……这样的吧。

仔细想想，感觉阿西莫夫的心理史学真的有可能实现呢。

这部小说被誉为“人类想象力的极限”，瞎扯了这么多，我赶紧回去继续看了哈哈。