世界顶级围棋选手李世石在韩国首尔举行的谷歌 DeepMind 挑战赛中对阵谷歌的人工智能程序 AlphaGo,时间为 2016 年 3 月。

第一部分

1.1

与大多数科学研究领域不同,人工智能(AI)研究呈现出一种两极化的存在,交替经历着狂热雄心与自我厌恶的低谷。这种波动的历史始于 1956 年的一个高峰,当时在达特茅斯举行的一个夏季会议上,AI 的奠基者们为这一领域命名并概述了其目标。会议汇聚了新兴计算机科学领域的顶尖人物,包括克劳德·香农、马文·明斯基和约翰·麦卡锡。他们承诺,在“两个月、十人研究”的条件下,将能够在 AI 基本问题上取得“显著进展”。这些问题包括:计算机如何使用语言,“假设性”神经元如何形成概念,以及自我改进在计算机学习中的作用。那个夏天并未取得显著的技术进步,而在接下来的几十年里,基本问题上的进展也微乎其微。迄今为止,AI 研究尚未实现其更深层次的雄心,其有限的成就是否能揭示最简单动物智能的工作机制,仍存疑问。

然而,在琐碎的追求——尤其是游戏方面——人工智能取得了更多成就,尽管比原计划晚了数十年。计算机科学可以通过两种方式衡量游戏领域的进展:首先,通过游戏是否已被“解决”——即预测完美游戏最佳结果的数学证明——其次,通过让冠军选手与计算机程序对战。前一种技术虽借助计算机辅助,但本质上仍是数学问题,而后一种则依赖于现有选手的质量。两者并非相互依存,尽管从数学上解决游戏可能更具智力严谨性,但在高调比赛中击败世界冠军能获得更好的宣传效果。例如,世界级的国际跳棋程序在 20 世纪 90 年代出现,但该游戏直到 2007 年才被“弱”解决。国际象棋仍部分未解,或许将永久保持部分未解状态,但最优秀的人类棋手加里·卡斯帕罗夫在 1997 年著名地败给了 IBM 的深蓝计算机。

去年,英国人工智能公司 DeepMind(隶属于谷歌)宣布,他们开发了一款名为 AlphaGo 的计算机程序,能够击败职业围棋选手。围棋是一项有着 2500 年历史的棋类游戏,与国际象棋不同,围棋曾被认为过于复杂,人工智能难以掌握。它也很可能将永远保持未解之谜的状态。围棋的规则很少——总共大约十条——在 19 乘 19 的网格上进行。然而,尽管围棋的规则简单,但它比其他棋类游戏更难计算,这既因为可能的走法数量庞大,也因为任何时刻棋子价值的确定都十分困难。因此,围棋常被视为一种策略性强但直觉主导的游戏。围棋高手能够指出一步好棋并解释其为何是好棋,但要通过数学形式量化这一步棋的优势则要困难得多。国际象棋虽然规则更多但可能的走法较少,因此更容易被机器计算和搜索。例如,IBM 的深蓝每秒可以搜索 2 亿步棋。 即使以当代计算速度而言,采用相同搜索算法的围棋程序也无法彻底评估某一时刻所有可能的走法。一台围棋机器必须能够直观地进行对弈,而这是任何计算机都无法做到的;在 AlphaGo 问世之前,人工智能研究者认为能够击败职业棋手的围棋程序是不可能实现的。

直到去年十月,AlphaGo 击败了世界排名第 663 位的欧洲冠军樊麾。然而,观察者们对这一成就的赞誉有所保留:DeepMind 的程序确实是一项成就,但理论上,相当一部分围棋冠军仍有可能击败它。第二轮比赛定于次年三月在韩国首尔举行,对手是世界顶级棋手李世石。尽管数千万观众通过电视观看了比赛,AlphaGo 最终赢得了比赛,五局四胜。这一胜利在人工智能历史上创造了两个首次:一个重大目标比任何人预想的都要早得多地实现了,人类棋手不再主宰这项最古老且最受尊敬的棋类游戏。

加里·卡斯帕罗夫在 1997 年纽约与 IBM 的深蓝计算机进行的第六场也是最后一场比赛开始时抱着头

1.2

如果一位虚构的计算机科学家要建造一台能够写小说的机器,她可能会首先将小说分解成其基本组成部分,将叙事分割成句子,句子分割成语法,语法分割成音素。我们这位虚构的计算机科学家——假设她是一位认知科学家——首先需要了解自然语言的工作原理、其规则和结构、其生成能力。同时,她和她的团队会绘制叙事结构图,理解那些产生更大、更复杂叙事形式的简单规则。从那里,她可能会构建一个关于读者群和文化的一般人类学,以准确理解一个故事为何吸引观众。这位计算机科学家需要各种语言学家、程序员、人类学家、历史学家、文学理论家……一群致力于科学理解迄今无人完全理解的事物:文学如何运作的研究人员。

第二位计算机科学家会采取不同的方法。与其试图理解那些无法知晓的事物,第二位科学家会构建一台能够自主学习的计算机。这台计算机将从一张白纸开始;它不会理解什么是音素、句子、小说或婚姻情节。唯一被编程的任务是识别模式并对其进行分类。也许它会受到人类输入的引导,或者可能不需要任何人类协助。在查看了数百万个数据点——语法书、数十亿的网页、畅销书、杂志——之后,它会形成对英语句子样貌的概念,以及例如侦探情节可能呈现的形态。也许机器的学习会通过一个奖励系统得到补充,其中优秀的叙事、获奖的叙事将获得比平庸之作更高的评分。与我们的第一位计算机科学家不同,第二位科学家的唯一任务是构建一台能够学习、对奖励做出反应的计算机,一个硅基版本的激进行为主义,其中我们的人工小说家通过重复和强化学习写作。

两位虚构科学家所采用的方法,随着年代的不同,曾是人工智能研究中最流行的技术。符号人工智能(Symbolic AI),常被称为“老式人工智能”(GOFAI),一度主导该领域;然而,正如其更长的名称所暗示的那样,GOFAI 已不再拥有昔日的地位。起初,GOFAI 背后的推理虽有些盲目,但还算合理。既然计算机是符号的通用操纵者,而精神生活涉及符号的操纵,那么就可以构建一台拥有精神生活的计算机。这种思路导致了复杂“知识库”和本体分类学的创建,这些知识库和分类学由对象和语言符号的层次结构组成。计算机被教导空间有方向,球是一种物体,而像球这样的物体可以在空间中从左向右移动。机器人被制造出来移动球,当机器人需要执行新任务时,新的本体论和分类学就会被构想出来。 显然,没有人想到的是,需要分类的符号数据量是未知的,可能是无限的,而且这些数据的分类本身就是社会建构的,即它在时间和空间上都会发生变化。更具破坏性的是,尽管大脑可能在某种程度上像基于硅的计算机一样工作,但在许多情况下它并不像计算机——尤其是在其结构上,它是大规模并行的,与计算机不同,它不基于布尔代数。

这促使科学家们反过来思考:与其认为大脑像计算机一样工作,为什么不构建像大脑一样工作的计算机,用硅“神经元”并行工作,并随着时间的推移强化它们之间的连接。这种“连接主义”运动在二十世纪起起落落,但如今它通常被认为是所有人工智能研究领域中最成功的一个。我们的第二位科学家,行为主义者,属于连接主义运动,她选择的工具是人工神经网络。神经网络通过样本数据或与特定环境的重复交互进行训练;无论是训练还是强化都指导着它们的学习。网络可以适应特定的数据,而工程师无需事先了解太多关于数据的信息。这使得神经网络在涉及模式识别的任务中表现极为出色,例如。神经网络可以通过向程序输入数百万张猫和非猫的图像来训练识别照片中的猫。与符号 AI 不同,没有工程师需要弄清楚是什么让猫看起来像猫。事实上,工程师可以从机器那里学习到是什么让猫的特征具有猫的特性。 而鉴于基于规则(启发式)的可能性树搜索在掌握国际象棋方面表现出色,神经网络在包括围棋在内的其他类型游戏中表现更为优异。

显然,神经网络以及机器学习整体上成为 DeepMind 的专长。早在 AlphaGo 问世前几年,DeepMind 就开发了一款能够精通任何 Atari 2600 视频游戏的程序。Atari 2600 于 1977 年发布,是一款极为流行的家用视频游戏机,推出了包括《吃豆人》、《打砖块》和《青蛙过河》等数百款游戏。在开始游戏之前,DeepMind 的程序对这些游戏一无所知。在游戏过程中,它仅接收到屏幕像素信息、得分以及操纵杆控制。它的唯一任务是提高得分,并根据游戏情况避免被消灭。该程序并不理解控制如何运作或它正在控制什么。它通过试错开始游戏,进行了持续数千场游戏的马拉松式挑战,每一代都记住了越来越好的模式,以征服程序新进入的 2D 世界。

谷歌深度思维的深度 Q 学习玩雅达利的《打砖块》

视频展示了 DeepMind 程序在玩《打砖块》,这款经典的街机和家用视频游戏由史蒂夫·沃兹尼亚克和史蒂夫·乔布斯开发。游戏的目标是利用一个球在屏幕顶部的砖墙中开辟通道。球从墙体落下至屏幕底部,玩家需用挡板将球反弹回墙体。若球触底,玩家的回合即告结束。在前十分钟,程序的表现糟糕,近乎随机。挡板不受控制地左右颤抖;每当它碰到球时,似乎都是偶然。经过 200 次游戏,一小时的训练后,计算机的水平虽仍不佳,但已明显理解了游戏规则。挡板偶尔能找到球,尽管并非每次都成功。到 300 次游戏,两小时时,程序的表现已优于大多数人类。即使球以看似无法触及的角度反弹,也没有一个球能越过挡板。

DeepMind 的研究人员本可以在此刻停止游戏并转向其他游戏,但他们让程序继续运行。在又进行了两个小时的专家级游戏后,程序做出了研究人员都未曾预料到的举动:它发现了一种新颖的玩法,即利用球从墙的一侧穿透过去。当球穿过新形成的隧道时,它会反弹到墙后,从背后清除掉墙体。这是一种优雅且高效的玩法,展现了极端的简约之美。这也并非 DeepMind 工程师们所预见;这是程序学习过程中自发涌现的一种风格。

这种玩法风格是不可避免的吗?如果我们复制 DeepMind 的 Atari 玩家——制作两个、三个,甚至更多——然后将这些程序并行运行,每个程序会否发现相同的隧道策略?隧道是一种创造性的策略,还是寻找最佳玩法的结果?两个或三个不同的程序会演化出不同的玩法风格,还是它们的玩法总是会被精炼到最有效的方式?在像《打砖块》这样简单的游戏中,很容易想象效率而非创造性的风格将定义专家级玩法。程序只是在试图找到全局最大值,即以最少的努力获得最高分数。

然而,在像围棋这样极其复杂且富有美感的游戏中,专家的创造力和风格对于成为顶尖棋手至关重要。为了实现这一点,DeepMind 结合了神经网络和树搜索算法,后者在游戏 AI 中更为传统。训练过程始于处理 3000 万步人类棋局,但最终 AlphaGo 通过与自己对弈数千局来结束训练。后一阶段意味着 AlphaGo 能够发展出自己的棋风,而不仅仅依赖于从数据库中重复棋步。

在李世石与 AlphaGo 的第二场比赛中,这一点表现得最为明显。当时,在第 37 手,计算机下出了一步非常不寻常的棋。在比赛进行到这一步之前,已经出现了几步奇怪的棋,但第 37 手让英语直播解说员、顶级围棋选手迈克尔·雷德蒙德(Michael Redmond)难以置信地眯起了眼睛,盯着比赛的直播视频。“这是一步非常令人惊讶的棋,”他说道,他的头来回在棋盘和显示器之间转动,以确保自己没有看错。那一刻,明显受到影响的李世石离开了房间;几分钟后他回来了,并花了 15 分钟思考下一步棋。解说员显然对 AlphaGo 的这一步棋印象深刻,并不认为这是一个错误。他对另一位解说员说道:

AlphaGo 下出的一些不寻常的棋步会让我有些困惑。……它下的棋步绝对不是常规的走法。这些棋步在其数据库中出现的概率并不高。所以它是自己想出来的。……这是一种创造性的走法。

1.3

AlphaGo 并不具备自我意识。它的智能并非通用型。它无法拿起一颗围棋棋子。它无法解释其决策。尽管存在这些局限性,AlphaGo 的棋步不仅娴熟,而且极具原创性,令人望而生畏。然而,矛盾的是,AlphaGo 最令人畏惧的时刻恰恰是它犯错的时候。目前尚不清楚第 37 手是软件错误,还是在一场近乎完美的对局中的罕见失误。相反,这手棋也可能是超人般的精彩表现,是机器不受社会习俗限制而产生的卓越洞察。或者,这手棋可能是故意的随机之举。也许 AlphaGo,一个没有心理学的程序,意外地掌握了心理战的二手理解。AlphaGo 永远无法知道它的这一手会让李世石离席,但机器可能已经理解了这一手对对手棋局的影响。

这种令人不安的举动并非没有先例。在 1997 年第一场深蓝与加里·卡斯帕罗夫的对决末尾,计算机在第 44 步将车移动到了一个出人意料的位置。尽管深蓝最终输掉了比赛,但这一步棋如此反直觉——或许可以说是糟糕的——以至于卡斯帕罗夫在接下来的比赛中一直思考深蓝是否掌握了他所不了解的东西。分心之下,卡斯帕罗夫输掉了第二局。后来,统计学家内特·西尔弗的采访揭示,这一步棋是由于软件漏洞所致。深蓝无法选择一步棋,于是默认选择了完全随机的走法。卡斯帕罗夫担心这一步棋背后有更深层次的策略,而实际上,它仅仅是偶然的结果。

在《信号与噪声》一书中,西尔弗认为深蓝的随机走法不应被视为具有创造性。他将这一步与鲍比·费舍尔在 1956 年与唐纳德·拜伦的对局中所做出的马和后的牺牲进行了对比(即著名的“世纪之战”)。当时年仅十三岁的费舍尔巧妙地诱使拜伦吃掉了他两个重要的棋子,将这位资深大师引入了一个在棋史中前所未有的陷阱。西尔弗认为,没有一台计算机会做出这样的牺牲。西尔弗说得没错:计算机下棋的启发式算法偏向于保守的走法。计算机无需像年轻而才华横溢的费舍尔那样大胆和炫目。但 AlphaGo 并非使用简单的启发式算法。它的神经网络构建的目的不是重复过去的棋局,而是创造新的策略。这并不排除出现坏棋的可能性,但减少了纯粹随机走法的可能性,正如卡斯帕罗夫的情况。换句话说,AlphaGo 使用神经网络增加了第 37 步棋具有新颖性和创造性的可能性,尽管这可能并非是卓越的杰作。

人们很容易认为,李世石的焦虑,如同卡斯帕罗夫一样,源于他无法区分卓越与失误。评论员们对此步棋非常重视,尽管其中一位最初承认:“我以为这是个错误。”AlphaGo 围绕这一步棋构建了胜局,这一事实被用作证明此步棋具有创造性和技巧性的证据,但这可能是事后合理化的结果。另一种解释是,AlphaGo 下了一步坏棋,但随后通过更出色的棋局表现弥补了这一失误,使得事后看来,这步棋显得比实际更好。

无论现实如何,第37手棋将机器创造力的复杂不可判定性浓缩为单一时刻。但如果问题比表面看起来更具可判定性呢?如果我们说,创造不需要作者或生命体,真正的问题在于我们坚持作者的首要地位,这又如何?这一立场并不像听起来那么荒谬,尤其当考虑到达尔文的自然选择是无目的、无方向且无创造者的,却是科学已知的最具创造力的力量。自然选择让我们走到今天;它甚至创造了设计 AlphaGo 的计算机科学家的头脑。因此,如果形式创造不需要意向性,且自然选择是人类智能的源泉,那么人工创造力可以被视为并非真正创造力的仿制品,而是通过其他手段延续自然选择的创造力。换言之,自然中的“错误”——突变——推动了进化,正如适应性通过偶然性产生,AlphaGo 的制胜一招是否偶然或许并不重要。 重要的是,移动成功了。正如机器学习将过去的成功——无论是偶然的还是非偶然的——保存在记忆中一样,自然选择通过遗传继承记录过去的成功,从数百万次幸运的错误中构建复杂的生物体。因此,与许多流行的假设相反,进化并不是一个纯粹的随机过程,而是一个利用信息存储作为抵御环境的堡垒的过程,保留好的意外,丢弃坏的。通过这种方式,随机软件错误或出乎意料的糟糕操作示例,只要在特定上下文中对程序有利,就可以被视为类似于基因突变和漂移:只要错误在特定上下文中对程序有利,它是否是有意的并不重要。

但或许理解机器创造力的最佳方式是通过其陌生性;就像自然选择一样,人工创造力或许在其运作最不为人所熟知时最为强大。正如围棋大师樊麾在谈到第 37 手时所说:“这不是人类的一手。我从未见过人类下出这一手。如此美丽。”

左 - 皮特·蒙德里安,“线条构成,第二状态”, 右 - A. 迈克尔·诺尔,“计算机线条构成”

第二部分

“潜意识是无穷无尽且无法控制的。它的力量超越了我们。它如同脑细胞的最后一个粒子般神秘。即便我们了解它,也无法重构它。” –特里斯坦·查拉

“你坚持认为机器无法完成某些事情。如果你能准确地告诉我机器无法完成什么,那么我总能制造出一台能完成那件事的机器。” –约翰·冯·诺依曼

2.1

五十年前,贝尔电话实验室的工程师 A. 迈克尔·诺尔向一百名测试对象展示了两幅图片和一个问卷。这些对象大多是贝尔实验室的同事,按照任何自尊的工程师可能会做的那样,被分为“技术”和“非技术”两类。前一类包括物理学家、化学家和计算机程序员,后一类则由其他人组成:秘书、职员、打字员和速记员。性别分布符合 1966 年企业研究中心的预期:技术组以男性为主,非技术组以女性为主。尽管部分受访者喜欢抽象艺术,但用诺尔的话说,所有对象都是“艺术上幼稚的”。

向受试者展示的两幅图像是几乎相同的抽象画的黑白复印件。这些画作是几何抽象风格,其风格与近 50 年前新造型主义先驱者的作品相似。两幅画作均仅由短的水平和垂直黑线组成,其中大部分排列成 T 形和 L 形。线条被一个看不见的圆圈所包围;圆圈本身在其四个最外侧被截断,使构图呈现出圆形且压缩的外观。两幅画中的线条分布相似,但并不完全相同。在两幅图中,T 形和 L 形的线条主要集中在包含圆圈的左、下和右侧,在负空间中形成了一个新月形。也许这些画作是一组双联画;或许其中一幅是另一幅的略微不准确的复制品。随附的问卷澄清道:“其中一幅是皮特·蒙德里安画作的照片,而另一幅是 IBM 7094 数字计算机绘制的图画的照片。您认为哪一幅是由计算机完成的?”

蒙德里安的画作是他 1917 年的《线条构成》。IBM 7094 的图片标题为《计算机线条构成》。很少有受访者能够分辨“哪一幅是由计算机完成的”。对于声称喜欢抽象艺术的受访者,以及声称不喜欢抽象艺术的受访者,这一点同样适用。奇怪的是,尽管对抽象艺术的强烈偏好表明了较弱的识别计算机生成绘画的能力。26%的抽象艺术爱好者正确识别了计算机绘画,相比之下,不喜欢抽象艺术的 35%的人做到了这一点。诺尔还询问了受试者他们更喜欢哪一幅画的美学。60%的受试者更喜欢计算机绘画,这再次与对抽象艺术的偏好强烈相关。蒙德里安似乎在自己的潜在爱好者中表现也很差。

蒙德里安的《带有线条的构图》,人们认为,是以典型的方式创作的:数小时的画室时间,油画颜料和画笔,专注,失败的开端,断断续续的发展,最终的突破。据我们所知,画作中的水平和垂直线条之所以出现在画布上,是因为蒙德里安对画面平衡的感知,而非依赖《易经》或轮盘赌的外部随机操作。当然,没有人确切知道是什么引导蒙德里安将某条线放置在画面平面的特定坐标上。我们只有假设的意图,这些假设倾向于,正如评论家告诉我们的,是错误的。诺尔说得最好:“蒙德里安在创作这幅画时遵循了某种方案或程序,尽管确切的算法未知。”

通过计算机组合线条,确切的算法是已知的。必须如此;计算机永远都是刻意的。为了让蒙德里安程序运行,算法的每一步都必须详细说明,指令逐一列出,先绘制出图像。

然而,如何构建一个算法蒙德里安呢?诺尔理解蒙德里安绘制《线构成》的一般技巧,但关键细节需要明确。为什么线条放在这里而不是那里?什么决定了任何给定线条的长度?答案当然是蒙德里安。没有这位画家,诺尔转向了随机性。

2.2

让我们暂时沉浸在一个虚构的故事中。这个虚构故事分为几个部分,都与机器有关。首先,我们必须相信只有人类制造机器。这似乎很容易接受。毕竟,动物很少使用工具,更不用说制造机器了。虚构的第二部分同样容易让人相信。它声称生物不是机器。它像一个毫不掩饰的新活力论者那样说,有机体不能通过机械原理来解释。尽管这一观点早已被科学界否定,但大多数非科学家仍然相信,某种生命力将生命与无生命区分开来。现在,让我们暂时接受这种活力论的偏见:生命中没有任何机械的成分。最后,我们需要将“机器”的定义严格限制在字面意义上,避免使用任何比喻性的用法。社会不能是机器。生态系统不能是机器。欲望不能是机器。机器就是我们天真地认为它们所是的东西:由人类制造的机械系统,需要能量并施加力量。蒸汽机、打印机、时钟、胶片相机,甚至是摆钟和齿轮。 如果我们接受这个简化的、虚构的机器定义,我们必须首先承认,所有机器都是确定性的。机器只会做它们被设计来做的事情,不会更多。一旦机器的机制被构建,其功能就永远固定了。没有人类的干预,蒸汽机永远不会变成油钻;汽车永远不会变成相机。在更复杂的机器中,这些确定性的功能可以分解为更基本的机械原理,这些原理可以通过数学物理精确描述。因此,每台机器都有其自身的核算,严格的物理限制、能量限制和生产能力。正如哲学家乔治·康吉莱姆在《机器与有机体》中所写:

在机器中,理性会计的规则被严格验证。整体严格等于各部分之和。效果取决于原因的顺序。此外,机器表现出明显的功能刚性,这种刚性因标准化实践而愈发显著。

如果机器严格确定性、标准化,如果它们永远只是其各部分的总和,那么否认机器具有创造性主体地位就变得容易。一个确定性系统只能产生相同的结果;它只能作为创造力的媒介。以谐振器为例——一种简单的机器,使用两个或多个摆锤来制作复杂曲线线条的图画。随着摆锤摆动,它们的力移动机械臂,进而使笔在固定的一张纸上绘图。由此产生的图画是重力物理的结果,而非人类手或思维的产物。根据定义,这些物理现象是可重复且可以用数学描述的。如果说谐振器绘图中有任何创造性可言,那也是归功于谐振器的发明者或组装者,而非在纸上移动的机械臂。谐振器不应因其作品而获得版税,也不能因版权侵权而起诉其他谐振器。如同相机一样,谐振器本身没有主体性;它只能被视为一种媒介。

这也适用于计算机。然而,计算机也是一类特殊的机器。计算机不仅受其自身确定性力学的影响,而且只要这些力学在数学上可描述,它们还能模拟任何其他机器的力学。通过一些努力,我们的谐振器可以被编码成一个程序,该程序配备了一个基本的物理引擎,将产生与物理谐振器完全相同的绘图。与谐振器一样,该程序是确定性的。它没有自主性。它无法超越自身的逻辑。同样,如果一台计算机能够生成蒙德里安风格的图片,那只是因为蒙德里安为这种模拟提供了模板。计算机本身无法独立达到新造型主义。

有趣的是,Noll 选择随机性作为计算机作曲区别于蒙德里安并在这位大师的游戏中胜出的特质。在计算机作曲中,所有线条的位置都是随机选择的。线条的宽度可以在 7 到 10 扫描线之间;其长度可以在 10 到 60 点之间的任何位置。(扫描线和点描述了微缩胶片绘图仪阴极射线管的垂直和水平轴。)任何落在作品顶部抛物线区域内的线条,都会根据其与抛物线边缘的距离按比例缩小。通过一些试错,Noll 可以制作出一个线条分布可能由画家决定的蒙德里安风格作品。

诺尔认为,他研究的真正主题并非社会学品味——即具备足够教育背景以识别蒙德里安真迹或赝品的能力——而是观众如何对随机性作出反应。一方面,他写道,抽象绘画的爱好者不仅容忍构图的随机性,他们还主动追求这种随机性。一个更具随机性的蒙德里安作品被视为更好的蒙德里安。相反,对于那些不熟悉计算机或抽象绘画的人来说,一幅更有序、随机性较少的画作与计算机相关联。因此,他们猜测,更有序的画作,即蒙德里安的作品,是由计算机创作的,而更具随机性的画作则是人类所为。双方都认同一点:随机性与创造力是相连的。两组人都将随机性视为计算机无法达到的品质;尽管他们可能并不清楚原因,但两组人的看法都是正确的。

2.3

从一开始,人工智能就致力于超越机器的确定性限制。这适用于所有形式的决策,更不用说创造力了。尽管基于规则的人工智能方法主导了该领域数十年,但显而易见的是,程序的优劣取决于其信息本体论。最重要的是,这些程序的学习能力有限;它们只能沿着预定义的决策树前进。基于规则的人工智能可能会产生能力,但永远不会产生创造力。

与人工智能领域的许多其他方面一样,能力与创造力之间的区别可以在 1956 年的达特茅斯提案中找到。在其中,与接下来半个世纪的大多数人工智能研究领域并列,作者们建议研究“随机性与创造力”。他们写道:

一个相当吸引人但显然尚未完成的猜想是,创造性思维与缺乏想象力的合格思维之间的区别在于引入了某种随机性。这种随机性必须由直觉引导才能有效。换句话说,受过教育的猜测或直觉在有序思维中包含了受控的随机性。

几乎与达特茅斯会议同时,在社会的另一个完全不同的领域,艺术家们开始寻求随机性,以打破传统的创造力观念。起初,这两个群体似乎完全相反:天真的计算机科学家期望轮盘赌能产生米开朗基罗式的作品,而前卫艺术家则用美学上的精致换取了偶然的混乱。然而,两者之间的共同点可能比他们想象的要多。像约翰·凯奇、杰克逊·波洛克、罗伯特·马瑟韦尔、莫顿·费尔德曼和伊安尼斯·泽纳基斯等艺术家和作曲家,利用随机性来削弱有意识的思维。在他们看来,意识已经使创造力僵化。创造力已经变得,简而言之,是确定性的。

马塞尔·杜尚,《三标准停摆》(3 Standard Stoppages),1913-1914 年(1964 年复制品),马塞尔·杜尚 1887-1968。

2.4

达特茅斯人工智能会议一年后,艺术家、作家兼科学家乔治·布雷特撰写了“偶然意象”,概述了现代主义艺术中的偶然操作。(尽管写于 1957 年,布雷特直到 1966 年才发表此文。)该文既基于布雷特作为研究化学家的科学知识,也反映了他作为概念艺术家的兴趣发展。与所引用的许多现代主义宣言不同,“偶然意象”是一部理论立场异端的作品。在其中,布雷特将弗洛伊德的自由联想与铃木大拙的思想、达达主义与热力学、《百万随机数字》与超现实主义诗歌融为一体。

布莱希特将机遇大陆划分为两个领地。第一个是自动主义:意识流、直觉判断、非理性联想。第二个是数学和物理上的机遇,从轮盘赌到随机数表。对布莱希特而言,这两种机遇都是摆脱偏见的途径。正如马塞尔·雷蒙所写,潜意识不会撒谎。对于安德烈·布勒东来说,潜意识是奇妙事物的工厂。让·阿尔普相信,机遇赋予他“精神洞察力”。这种高涨的修辞是普遍的:现代主义艺术家可能不是最早使用机遇操作的人,但他们是最热衷于将其提升至近乎宗教高度的人之一。根据布莱希特的说法,“先锋作品”是马塞尔·杜尚的《三标准停摆》。制作于 1913 年和 1914 年,杜尚——限制自己的工具为风、重力和目标——从一米高处将一米长的线掉落到空白画布上。他将线固定在画布上,沿着弯曲的线边缘剪裁画布,并沿着一个边缘剪裁一块木头以匹配弯曲的线。然后他再重复这一过程两次。 最后,这六块玻璃和木头被装入一个定制的木盒中。杜尚说,结果就是“罐装的偶然”。”

杜尚并非 20 世纪唯一将“机遇”装罐保存的人。至少,“机遇”也被印刷成册,因为科学研究人员需要越来越多的随机数。尽管随机性在工业和学术界需求旺盛,但获取它却日益困难。如果需要成千上万的随机数,传统的生成方法——如抛硬币、掷骰子等——将极为繁琐。更糟糕的是,研究人员深知许多物理过程可能存在偏差:一个真正公平、不偏不倚的抛硬币结果,实际上比看起来要难得多。为了满足需求,研究机构出版了随机数书籍,其中许多至今仍在使用。布莱希特,多年来以职业化学家的身份为生,对这一行业了如指掌,他的文章是少数涉及艺术与机遇并提及随机数生产这一小众行业的作品之一。其中最著名的书籍是兰德公司 1955 年出版的《百万随机数字与十万正态偏差》。 该出版物堪称该领域的经典之作,包含数百页的随机数字,可供统计学家、民意调查员、计算机科学家及其他需要随机输入的职业人士选用。第二本书是 1949 年由州际商务委员会等机构出版的《105,000 个随机小数表》。为了制作 1949 年的这本书,ICC 从运单中选取了数字数据,布莱希特将其过程比作超现实主义的“精美尸体”创作方法。RAND 公司出版的书籍则是通过电子轮盘生成的,这一定制设备由道格拉斯飞机公司的工程师设计,与传统轮盘赌轮盘关系不大。RAND 的设备利用了一个噪声模拟源——随机频率脉冲发生器——来生成数字。这两种技术有一个共同点:它们都不依赖计算手段来生成随机数,这是因为计算机永远无法产生真正的随机性。与达特茅斯提案相反,计算机无法“注入”随机性到思维中。它们无法在提问时生成一个随机问题。原则上,它们也无法公平地洗一副虚拟的牌。 其原因已提及:计算机永远都是确定性的,没有任何确定性操作能产生随机数。正如数学家约翰·冯·诺依曼所写:“任何考虑用算术方法生成随机数的人都当然处于罪恶之中。””

无论是否带有罪恶感,计算上的随机性时刻都在发生。在线赌场每天都会洗牌虚拟纸牌数百万次。每毫秒,加密协议都使用随机数来加密计算机之间的通信。这是如何实现的呢?如果计算机无法产生随机性,那么计算机又是从何处获取随机性的呢?一种产生随机性的计算方法是完全避免使用算术方法。如果需要一个随机数,就必须从计算机系统外部获取。在某些情况下,赌场软件会调用连接到物理上真正随机系统的计算机,例如大气噪声或放射性衰变。(大气噪声是 Random.org 所使用的,它是《一百万个随机数字》的现代继承者。)然而,尽管随机物理系统保证了真正的随机性,但它们可能速度慢且无法满足对随机数的高需求。第二种更具扩展性但并不完美的方法是使用伪随机数生成器(PRNG)。PRNG 是一个程序,它基于冯·诺依曼的“坏信仰”运作;它试图让一个确定性的数学过程产生出乎意料的结果。 冯·诺依曼本人提出的最早的伪随机数生成器(PRNG)之一是中间平方法。中间平方法在生成随机数方面几乎毫无用处,但它确实为理解一个(糟糕的)PRNG 的工作原理提供了一个简单的入门。要使用中间平方法,首先选择一个四位数,将该数平方,取八位结果的中间四位,并将这四位作为你的随机数。如果需要另一个数,则从新的数开始重复此过程。不难看出,这种方法可能会遇到问题,特别是当中间的四位数全为零时。更糟糕的是,仅在几代之后,很快就能看出中间平方法生成的某些数字比其他数字更多。用布莱希特的话来说,中间平方法是无可救药地偏向的。

机器的部分就说到这里。但人类呢?人类能产生随机数吗?换句话说,如果要求一个人想出一长串随机数,如果这个人不加思考,被要求脱口而出这些数字,或许是在潜意识的驱使下,那么每个数字出现的概率是否与其他数字相同?根据现代主义艺术家的观点,答案应该是“是的”——毕竟,偶然性操作,尤其是达达主义的那种,旨在使艺术家摆脱偏见。正如布莱希特对达达主义者的描述,如果潜意识摆脱了“父母、社会习俗以及所有其他对思想自由的人为限制”,那么它应该能够做到确定性机器无法做到的事情:生成随机性。

遗憾的是,无论潜意识可能是什么,它都不是公正无私的。事实上,它可能比有意识的思维更具决定性。作为专业化学家的布雷特知道,跨学科研究表明,潜意识和反射行为即使不是决定性的,也表现出一定的模式,无法摆脱社会条件的影响。本世纪初,弗洛伊德的《日常生活中的心理病理学》提出,潜意识并不是一个良好的随机数生成器。(“有一段时间,我意识到自己无法随心所欲地想到一个数字,甚至是一个名字。”)不久之后,伊万·巴甫洛夫证明了反射可以被条件化,也可以被去条件化。到了本世纪中叶,正如布雷特所写,统计学家证明,即使是在为测量而选择小麦植株时,人类测试对象也表现出偏见。对于科学家来说,潜意识是高度决定性的,更像是一个自动装置,而非自动的。

克劳德·香农的读心机器,1953 年

信息科学之父克劳德·香农发明了游戏和机器来阐释这种决定论。香农曾与他的妻子玛丽·伊丽莎白·“贝蒂”·摩尔(也是一位数学家)玩过这样一个游戏。游戏中,香农会从一本侦探小说中随机挑选一个字母大声读给摩尔听。然后,他会让她猜句子中的下一个字母。在告诉她正确答案后,她再猜接下来的字母,香农会揭示答案,他们就这样逐字逐句地读完整本书。她很可能一开始猜错了单词的第一个字母,但随着更多字母的揭示,猜中下一个字母的几率也随之增加。这是因为随着一个单词的逐步显现,任何字符出现的概率显著下降。字母 P 后面可能跟着许多字母,但字符串“probabl”后面很可能会跟着字母 E。字母往往具有统计学上可能的组合,因此如果当前字母是 Q,摩尔几乎可以确定下一个字母会是 U。 香农在其研究中形式化的内容是我们都凭直觉知道的东西:英语,像所有语言一样,具有统计上的规律性,我们已经内化了这些规律,尽管我们可能无法有意识地将概率用数字表达出来。

第二款游戏名为“读心机”,需要一个定制的机械装置,带有按钮和两个指示灯。玩家说出“左”或“右”并按下按钮。机器(未配备声音输入)通过点亮左侧或右侧的灯来猜测玩家所说的方向。玩家记录机器是否猜对。如果机器与玩家的选择一致,则机器得一分。如果猜错,则人类得一分。机器采用了一个简单的算法来猜测玩家的下一个选择,该算法灵感来自埃德加·爱伦·坡的《失窃的信》中暗示的用于玩“奇偶游戏”的策略。只要人类未能识破该算法,机器就有很大机会猜中玩家看似随机的选择。尽管“读心机”原始,但它表明潜意识具有半规律性;它并非意外之源。其运作方式或许甚至可以被一台非常简单的机器所模仿。

2.5

信息即惊喜,克劳德·香农写道。信息是我们未曾预料的,也是我们尚未拥有的。如果我们已经掌握了所有信息,就没有必要发送消息。如果我们已经拥有消息中的信息,那么这条消息就是冗余的。冗余的消息可能意味着更多信息——“如果发送两次,消息为假”——或者它可能是对抗噪声的解药。无论哪种情况,如果消息是冗余的,它就是可预期的。冗余可以被减少,被压缩。零,零,零,零……接下来是什么?另一方面,对于一个随机字符串,我们无法预知下一个数字是什么。因此,随机性是纯粹的信息。一个随机字符串充满了信息,其信息量甚至超过任何英语单词。随机字符串,如同信息一样,是惊喜。因此,机会也是惊喜。纯粹的机会无法被减少。它无法被压缩。它无法被预见。机会,正如让·阿尔普所言,是“致命的雷电”。

当我读到阿普的这句话时,不禁想起了九段围棋大师李世石。今年三月,他在与谷歌 DeepMind 的围棋程序 AlphaGo 的五局比赛中败北。正如本文第一部分所讨论的,在第二局比赛中,AlphaGo 下出了一步出人意料且极具创意的棋——第 37 手,这让李世石震惊不已,离开了比赛房间,最终输掉了比赛。AlphaGo 围绕第 37 手构建的策略并非来自公开已知的棋谱数据库。第 37 手在围棋 5500 年的历史中是全新的,属于一种围棋评论员有时称之为“非人类”和“外星人”的棋风。在接下来的几个月里,AlphaGo 继续发展这种外星棋风,据 DeepMind 首席执行官 Demis Hassabis 称,李世石已经开始向机器学习。

让我们回到关于机器的虚构中。机器不能制造其他机器的说法是不真实的。从冯·诺依曼复制器到自组装机器人,再到整个机床行业,无论是在理论上还是现实中,都存在能够制造其他机器的机器。同样,机器不能改变功能的说法也是不真实的。计算机是多功能机器的最佳例证。就微生物学而言,没有必要相信生命遵循与非生命不同的物理原理。然而,仍然存在决定论的问题。机器能否沿着非决定性的路线运行?换句话说,机器能否超越其各部分的总和?它能否具有创造性?答案并不在于随机性或随机算法,而在于学习。学习——将经验融入决策的能力——是区分决定性和随机系统的关键。生命可能遵循与非生命相同的物理定律,但有一个关键区别:它能够学习。也不需要意识——生物体学习所需的一切就是遗传。最简单地说,遗传代表了过去成功的记录。 在更复杂的层面上,免疫系统会记住感染,大脑会记录记忆。当人工智能学会下围棋时,当它像 AlphaGo 那样创造新的棋风时,它是基于从神经强化中抽象出的原理进行操作的。AlphaGo 学会了如何下围棋,它发明了新的策略,现在它正在将这些风格传授给李世石。当一个系统能够学习时,该系统就不再是确定性的。它是适应性的,它是复杂的,并且它是具有创造力的。