人工智能革命:通往超级智能之路
我们正处在变革的边缘,其规模堪比地球上人类生命的崛起。——弗诺·文奇
站在这里是什么感觉?
站在这里似乎是个相当紧张的位置——但你必须记住,站在时间图上的感觉是:你看不到右侧的情况。所以,实际站在那里的感受是这样的:
这感觉可能相当正常……
遥远的未来——即将到来
想象一下,乘坐时光机回到 1750 年——那是一个世界永远处于停电状态的时代,远距离通讯要么靠大声喊叫,要么向空中开炮,所有交通工具都依赖干草驱动。当你抵达那里,带回一个人,将他带到 2015 年,然后带他四处走走,观察他对一切的反应。我们无法理解他看到闪亮的胶囊在高速公路上飞驰、与当天早些时候还在大洋彼岸的人交谈、观看千里之外进行的体育比赛、聆听 50 年前的音乐表演、摆弄我的魔法矩形装置(他可以用它捕捉现实图像或记录生活瞬间,生成一张带有超自然移动蓝点的地图显示他的位置,看着某人的脸与他们聊天,即使他们身处国家的另一端),以及其他种种不可思议的魔法时,会是怎样的感受。这一切还只是在你向他展示互联网或解释国际空间站、大型强子对撞机、核武器或广义相对论之前。
对他来说,这种经历不会令人惊讶、震惊,甚至也不会令人震撼——这些词都不足以形容。他可能会真的丧命。
但有趣的是——如果他回到 1750 年,嫉妒我们能看到他的反应,并决定尝试同样的事情,他会使用时光机回到同样的时间距离,从大约 1500 年带一个人到 1750 年,向他展示一切。而 1500 年的人会对很多事情感到震惊——但他不会因此丧命。对他来说,这不会是一次疯狂的体验,因为尽管 1500 年和 1750 年有很大不同,但它们的差异远小于 1750 年到 2015 年。1500 年的人会学到一些关于太空和物理的惊人知识,他会对欧洲对新帝国主义热潮的执着印象深刻,并且不得不大幅修正他对世界地图的认知。但看着 1750 年的日常生活——交通、通讯等——肯定不会让他丧命。
不,要让 1750 年的人像我们和他一起时那样感到有趣,他必须回到更久远的过去——也许要一直追溯到公元前 12000 年左右,在第一次农业革命催生出第一批城市和文明概念之前。如果来自一个纯粹的狩猎采集世界的人——在那个时代,人类或多或少只是另一种动物物种——看到 1750 年庞大的人类帝国,高耸的教堂、横跨海洋的船只、“室内”的概念,以及人类集体积累的庞大知识和发现之山——他可能会被吓死。
然后,如果他在死后心生嫉妒,也想做同样的事情。如果他回到公元前 24,000 年,带回一个人到公元前 12,000 年,他会向那个人展示一切,而那个人可能会说:“好吧,你想表达什么?谁在乎呢。” 为了让公元前 12,000 年的人也能有同样的乐趣,他必须回到超过 10 万年前,找到一个他可以第一次展示火和语言的人。
为了让某人被传送到未来并因所经历的震惊程度而死亡,他们必须向前跨越足够多的年数,以达到“死亡级别的进步”,即一个死亡进步单位(DPU)。因此,在狩猎采集时代,一个 DPU 需要超过 10 万年,但在农业革命后的速度下,仅需约 1.2 万年。工业革命后的世界发展如此迅速,以至于 1750 年的人只需向前穿越几百年,就能经历一个 DPU 的发生。
这种模式——人类进步随着时间的推移越来越快——被未来学家雷·库兹韦尔称为人类历史的“加速回报定律”。之所以会发生这种情况,是因为更先进的社会有能力以比不太先进的社会更快的速度进步——因为它们更加先进。19 世纪的人类比 15 世纪的人类知道得更多,技术也更发达,因此人类在 19 世纪取得的进步远远超过 15 世纪也就不足为奇了——15 世纪的人类无法与 19 世纪的人类相提并论。
这种现象在较小的尺度上同样适用。电影《回到未来》于 1985 年上映,其中“过去”设定在 1955 年。在影片中,当迈克尔·J·福克斯回到 1955 年时,他对电视的新奇、汽水的价格、对刺耳电吉他的冷淡态度以及俚语的变化感到措手不及。那确实是一个不同的世界——但如果这部电影是在今天拍摄,而“过去”设定在 1985 年,那么电影可以展现更多、更大的差异。角色将置身于个人电脑、互联网或手机出现之前的时代——今天的马蒂·麦克弗莱,一个 90 年代末出生的青少年,在 1985 年会比电影中的马蒂·麦克弗莱在 1955 年更加格格不入。
这和我们刚刚讨论的原因相同——加速回报定律。1985 年至 2015 年的平均进步速度高于 1955 年至 1985 年,因为前者是一个更为先进的世界——因此,最近 30 年发生的变化远超前 30 年。
因此,进步正变得越来越大,发生得也越来越快。这预示着我们的未来将面临一些相当激烈的变化,对吧?
库兹韦尔提出,按照 2000 年的发展速度,整个 20 世纪的进步只需 20 年就能完成——换句话说,到 2000 年时,进步的速度已经是 20 世纪平均速度的五倍。他认为,从 2000 年到 2014 年,又完成了一个 20 世纪的发展进程,而到 2021 年,仅需七年时间,将再次实现一个 20 世纪的进步。几十年后,他相信一个 20 世纪的进步将在同一年内多次发生,甚至更晚些时候,不到一个月就能完成。总而言之,由于加速回报定律,库兹韦尔认为 21 世纪将实现 20 世纪进步的一千倍。
如果库兹韦尔和其他与他观点一致的人是正确的,那么到 2030 年,我们可能会像 1750 年的人对 2015 年感到震惊一样——也就是说,下一个 DPU 可能只需要几十年——而 2050 年的世界可能与今天的世界大相径庭,以至于我们几乎认不出来。
这并非科幻小说。这是许多比你我更聪明、知识更渊博的科学家们坚信不疑的观点——回顾历史,这也是我们理应做出的逻辑预测。
那么,为什么当你听到我说“35 年后的世界可能会变得完全无法辨认”时,你会想“酷……但不太可能”呢?我们对未来离奇预测持怀疑态度的三个原因是:
- 在历史的长河中,我们习惯于线性思维。当我们展望未来 30 年的发展时,往往会以过去 30 年的进步作为衡量标准,预测可能发生的变化。当我们思考 21 世纪世界将发生多大改变时,只是简单地将 20 世纪的进步叠加到 2000 年之后。这与 1750 年的人犯的错误如出一辙,他们找来 1500 年的人,期望对方能像自己一样,对同样时间跨度的未来感到震撼。线性思维对我们来说最为直观,但我们应该采用指数思维。如果有人更聪明一些,他们可能不会仅仅参考过去 30 年的进展,而是根据当前的发展速度来预测未来 30 年的进步。这样会更准确,但仍然相差甚远。要正确思考未来,你需要想象事物以比现在快得多的速度发展。
- 近期历史的轨迹往往讲述了一个扭曲的故事。首先,即使是一条陡峭的指数曲线,当你只观察其中一小段时,它看起来也像是线性的,就像你近距离观察一个大圆的一小段时,它几乎看起来像一条直线。其次,指数增长并非完全平滑和均匀。库兹韦尔解释说,进步是以“S 曲线”的形式发生的:
当新范式席卷全球时,进步的浪潮便塑造出一个 S 形曲线。该曲线经历三个阶段:
- 缓慢增长(指数增长的初期阶段)
- 快速增长(指数增长的后期爆发阶段)
- 随着特定范式的成熟而趋于平稳
如果仅着眼于最近的历史,你当前所处的 S 曲线部分可能会模糊你对事物发展速度的感知。1995 年至 2007 年间,互联网爆发式增长,微软、谷歌和 Facebook 进入公众视野,社交网络诞生,手机继而智能手机相继问世。那是第二阶段:S 曲线的快速增长期。但 2008 年至 2015 年在技术前沿上则显得不那么具有突破性。如今思考未来的人可能会审视过去几年以评估当前的发展速度,但这忽略了更大的图景。事实上,一个全新的、巨大的第二阶段增长期可能正在酝酿之中。
- 我们自身的经历使我们成为对未来固执己见的老人。我们对世界的看法基于个人经验,而这些经验已将近期的发展速度深植于我们脑海,成为“事物发展的规律”。同时,我们的想象力也受到限制,它利用我们的经验来构想未来的预测——但往往,我们所知的知识并不足以让我们准确思考未来。当我们听到一个与基于经验的认知相悖的未来预测时,我们的第一反应是认为这个预测太过天真。如果我在后文中告诉你,你可能会活到 150 岁、250 岁,甚至永生不死,你的直觉反应会是:“这太荒谬了——从历史中我唯一确定的就是人终有一死。”确实,过去没有人能逃脱死亡。但在飞机发明之前,也没有人能够飞翔。
因此,尽管你在阅读这篇文章时可能会觉得“不以为然”,但实际上这很可能是错误的。事实是,如果我们真正保持逻辑性,并期待历史模式继续下去,我们应该得出结论:在未来几十年里,将会有比我们直觉预期多得多的变化发生。逻辑还表明,如果一个星球上最先进的物种以越来越快的速度不断取得更大的飞跃,那么在某一点上,他们将实现一次如此巨大的飞跃,以至于彻底改变他们所知的生活以及他们对“成为人类”意义的理解——这有点像进化不断向智慧迈进,直到最终实现了向人类的巨大飞跃,彻底改变了任何生物在地球上生存的意义。如果你花些时间阅读当今科学和技术领域的进展,你会开始看到许多迹象在悄然暗示,我们目前所知的生活将无法承受即将到来的下一次飞跃。
通往超级智能之路
什么是人工智能?
如果你和我一样,曾经认为人工智能只是一个愚蠢的科幻概念,但最近你听到一些严肃的人在谈论它,而你却不太明白其中的含义。
很多人对“人工智能”这一术语感到困惑,主要有三个原因:
我们将人工智能与电影联系在一起。《星球大战》、《终结者》、《2001 太空漫游》,甚至《杰森一家》。这些都是虚构的,其中的机器人角色也是如此。因此,这让我们觉得人工智能听起来有点像是虚构的。
人工智能是一个广泛的话题。它涵盖了从手机计算器到自动驾驶汽车,再到未来可能彻底改变世界的某些事物。人工智能指代所有这些,这让人感到困惑。
我们在日常生活中无时无刻不在使用人工智能,但往往并未意识到那就是 AI。1956 年提出“人工智能”这一术语的约翰·麦卡锡曾抱怨道:“一旦它开始运作,就再没人称其为 AI 了。”正因如此,AI 听起来更像是一个神话般的未来预言,而非现实。同时,这也让它显得像是过去一个未能实现的流行概念。雷·库兹韦尔提到,他常听人说 AI 在 20 世纪 80 年代就衰落了,他将此比作“坚称互联网在 21 世纪初的互联网泡沫破裂时就已经消亡了”。
让我们来澄清一下。首先,别再想着机器人了。机器人是人工智能的容器,有时模仿人类形态,有时则不然——但人工智能本身是机器人内部的计算机。人工智能是大脑,而机器人则是它的身体——如果它有身体的话。例如,Siri 背后的软件和数据就是人工智能,我们听到的女声是那个人工智能的拟人化表现,而这里完全没有机器人参与。
其次,你可能听说过“奇点”或“技术奇点”这个术语。在数学中,这个词被用来描述一种类似渐近线的情况,即常规规则不再适用。在物理学中,它被用来描述一种现象,比如无限小且密度极高的黑洞,或者大爆炸之前我们都被压缩成的那一点。同样,这些情况下常规规则也不适用。1993 年,弗诺·文奇写了一篇著名的文章,他将这个术语应用于未来某个时刻,那时我们的技术智能将超越我们自身——对他来说,那一刻意味着我们所知的生活将永远改变,常规规则将不再适用。雷·库兹韦尔随后将事情弄得有些复杂,他将奇点定义为“加速回报定律”达到极端速度的时刻,此时技术进步似乎以无限的速度进行,之后我们将生活在一个全新的世界中。我发现,当今许多人工智能思想家已经不再使用这个术语,而且它本身也很容易引起混淆,所以我在这里不会过多使用它(尽管我们会在整个过程中聚焦于这一概念)。
最后,尽管人工智能(AI)作为一个广泛的概念,存在多种不同类型或形式,但我们需要考虑的关键分类是基于 AI 的能力水平。主要有三大 AI 能力类别:
狭义人工智能(ANI):有时被称为弱人工智能,狭义人工智能是专注于某一领域的 AI。例如,有 AI 能在国际象棋中击败世界冠军,但这是它唯一擅长的事情。如果让它找出在硬盘上存储数据的更好方法,它只会茫然地看着你。
通用人工智能(AGI):有时被称为强人工智能或人类级别的人工智能,通用人工智能指的是在各方面都像人类一样聪明的计算机——一种能够执行人类所能完成的任何智力任务的机器。创造 AGI 比创造 ANI 要困难得多,我们尚未实现这一目标。Linda Gottfredson 教授将智能描述为“一种非常普遍的智力能力,其中包括推理、计划、解决问题、抽象思考、理解复杂概念、快速学习以及从经验中学习的能力。” AGI 将能够像你一样轻松地完成所有这些事情。
人工超级智能(ASI):牛津哲学家及顶尖 AI 思想家尼克·博斯特罗姆将超级智能定义为“一种在几乎所有领域,包括科学创造力、普遍智慧及社交技能上,都远超最优秀人类大脑的智能。”人工超级智能涵盖从仅比人类聪明一点到比人类聪明万亿倍的计算机——全方位无死角。正是 ASI 的存在,使得 AI 话题如此引人入胜,也解释了为何“永生”与“灭绝”这两个词会在这些文章中反复出现。
截至目前,人类已在诸多方面征服了最低层次的人工智能——ANI,它无处不在。人工智能革命是从 ANI 出发,经由 AGI,最终通向 ASI 的道路——这条道路我们或许能够幸存,或许不能,但无论如何,它都将彻底改变一切。
让我们深入探讨该领域的顶尖思想家们如何看待这条道路,以及为何这场革命可能比你想象的来得更快:
我们当前的处境——一个运行在 ANI 上的世界
狭义人工智能是指在特定任务上达到或超越人类智能或效率的机器智能。一些例子包括:
- 汽车中充斥着 ANI 系统,从决定防抱死刹车何时启动的计算机,到调整燃油喷射系统参数的计算机。目前正在测试的谷歌自动驾驶汽车将配备强大的 ANI 系统,使其能够感知并应对周围环境。
- 你的手机就像一个小型的 ANI 工厂。当你使用地图应用导航、从 Pandora 获取个性化音乐推荐、查看明天的天气、与 Siri 对话,或是进行其他数十种日常活动时,你都在使用 ANI。
- 您的电子邮件垃圾过滤器是典型的 ANI(人工狭义智能)——它最初就具备识别垃圾邮件与非垃圾邮件的智能,随后根据您的特定偏好,通过经验学习并调整其智能。Nest 恒温器也是如此,它会逐渐了解您的日常习惯并相应地采取行动。
- 你是否经历过在亚马逊上搜索某件商品后,在其他网站上看到它被列为“为你推荐”的商品,或者 Facebook 似乎总能知道你应该添加谁为好友的诡异现象?这背后是一张由 ANI 系统编织的网络,它们相互协作,共享关于你是谁、你喜欢什么的信息,并利用这些数据来决定向你展示什么内容。亚马逊的“购买此商品的顾客还购买了…”功能也是如此——这是一个 ANI 系统,它的任务是从数百万顾客的行为中收集信息,并巧妙地综合这些信息来向你推销更多商品,促使你购买更多。
- 谷歌翻译是另一个经典的 ANI 系统——在某一特定任务上表现出色。语音识别也是如此,有许多应用程序将这两种 ANI 系统搭配使用,让你能够用一种语言说出句子,手机则用另一种语言输出相同的句子。
- 当你的飞机降落时,决定它应该停靠哪个登机口的并不是人类。同样,决定你机票价格的也不是人类。
- 世界上最好的跳棋、国际象棋、拼字游戏、双陆棋和黑白棋玩家现在都是 ANI 系统。
- 谷歌搜索是一个庞大的 ANI 大脑,拥有极其复杂的页面排名方法,并决定向你展示什么内容。Facebook 的新闻推送也是如此。
- 这些还仅仅是消费领域的应用。复杂的 ANI 系统在军事、制造业和金融等行业中得到了广泛应用(算法驱动的高频 AI 交易者占据了美国市场股票交易量的一半以上),并且在专家系统中也大显身手,比如协助医生进行诊断的系统,以及最为人熟知的 IBM 的沃森,它掌握了海量事实,并能巧妙理解特雷贝克式的隐晦表达,从而在《危险边缘》节目中击败了最出色的冠军选手。
当前的 ANI 系统并不特别令人恐惧。最糟糕的情况下,一个故障频发或编程不当的 ANI 可能会引发孤立性的灾难,比如导致电网瘫痪、造成核电站有害故障,或是触发金融市场灾难(如 2010 年的闪电崩盘,当时一个 ANI 程序对意外情况做出了错误反应,导致股市短暂暴跌,市值蒸发了 1 万亿美元,直到错误被纠正后,才部分恢复)。
尽管 ANI(人工狭义智能)尚不具备引发生存威胁的能力,我们仍应将这个日益庞大且复杂、相对无害的 ANI 生态系统视为即将改变世界的飓风的前兆。每一项新的 ANI 创新都在悄然为通往 AGI(人工通用智能)和 ASI(人工超级智能)的道路添砖加瓦。正如 Aaron Saenz 所认为的,我们世界中的 ANI 系统“就像早期地球原始泥浆中的氨基酸”——那些无生命的物质,在某个意想不到的日子,突然苏醒。
从 ANI 到 AGI 的演进之路
为何如此艰难
没有什么比了解创造一个与我们一样聪明的计算机有多么难以置信的挑战性,更能让你体会到人类智慧的珍贵。建造摩天大楼、将人类送入太空、探究宇宙大爆炸的细节——所有这些都比理解我们自己的大脑或制造出与之相媲美的东西要容易得多。迄今为止,人类大脑是已知宇宙中最复杂的物体。
有趣的是,构建通用人工智能(AGI,即一种在总体上与人类智能相当,而不仅仅局限于某一狭窄领域的计算机)的难点,并非如人们直觉所想。让计算机在一瞬间完成两个十位数相乘——极其简单。让它看一眼狗并回答是狗还是猫——却异常困难。开发出能在国际象棋上击败任何人类的人工智能?已经实现。但要让它阅读一本六岁儿童图画书中的段落,不仅识别文字,还要理解其含义?谷歌目前正投入数十亿美元试图攻克这一难题。对于计算机来说,诸如微积分、金融市场策略和语言翻译等复杂任务,简直易如反掌;而像视觉、运动、移动和感知这些对人类而言轻而易举的事情,对计算机来说却难如登天。或者,正如计算机科学家唐纳德·克努特所言:“人工智能如今已成功实现了几乎所有需要‘思考’的任务,但在大多数人类和动物‘无需思考’就能完成的事情上,却屡屡碰壁。”
当你深入思考时,很快会发现,那些对我们来说看似简单的事情实际上复杂得难以置信,它们之所以显得简单,是因为这些技能经过数亿年的动物进化,在我们(以及大多数动物)体内得到了优化。当你伸手去拿一个物体时,肩膀、肘部和手腕的肌肉、肌腱和骨骼会立即与眼睛协同,执行一系列复杂的物理运算,使你的手能在三维空间中沿直线移动。这对你来说毫不费力,因为你大脑中已经内置了完成这一动作的完美“软件”。同理,当你注册新账户时,恶意软件无法通过倾斜文字识别测试,并不是因为它愚蠢,而是因为你的大脑在这方面表现得极为出色。
另一方面,计算大数乘法或下棋对于生物体来说是新的活动,我们还没有足够的时间进化出精通这些技能的能力,因此计算机不需要太费力就能胜过我们。想想看——你更愿意编写一个能够计算大数乘法的程序,还是一个能够理解字母 B 的本质,以至于无论你展示给它的是数千种不可预测的字体或手写体中的哪一种,它都能立即认出那是字母 B 的程序?
一个有趣的例子——当你看到这个时,你和计算机都能辨认出这是一个由两种不同色调交替组成的矩形:
目前平局。但如果你拿起黑色并揭示整个图像……
…你能够毫不费力地详细描述各种不透明和半透明的圆柱体、板条以及三维角落,但计算机却会惨败。它会描述它所看到的东西——几种不同色调的二维形状——这实际上就是存在的。你的大脑正在做大量复杂的处理,以解读图片试图表现的隐含深度、色调混合和房间照明。而看下面的图片时,计算机看到的是二维的白、黑和灰色拼贴,而你却能轻易看出它实际上是什么——一张全黑的三维岩石照片:
我们刚才提到的所有内容,仍然只是在处理静态信息。要达到人类水平的智能,计算机必须理解诸如微妙面部表情之间的差异、愉悦、宽慰、满足、满意和高兴之间的区别,以及为什么《勇敢的心》很棒而《爱国者》却很糟糕。
令人生畏。
那么我们该如何实现这一目标呢?
创造 AGI 的第一关键:提升计算能力
要使通用人工智能(AGI)成为可能,计算机硬件性能的提升无疑是必要条件之一。如果一个人工智能系统要达到与大脑相当的智能水平,它就需要具备与大脑相当的原始计算能力。
表达这种能力的一种方式是大脑每秒能够处理的总计算量(cps),你可以通过计算大脑中每个结构的最大 cps,然后将它们全部相加来得出这个数字。
雷·库兹韦尔提出了一种捷径,他采用某人对某一结构的每秒计算次数(cps)的专业估计,并将该结构的重量与整个大脑的重量进行比较,然后按比例相乘,从而得出整体的估计值。这听起来有点不太可靠,但他多次使用不同区域的各种专业估计值进行这一计算,最终得出的总数总是落在同一个范围内——大约 10 的 16 次方,即 10 千万亿 cps。
目前,全球最快的超级计算机——中国的天河二号,实际上已经超越了这一数字,其运算速度达到了约 34 千万亿次每秒。但天河二号也相当庞大,占地 720 平方米,耗电 24 兆瓦(而人脑仅需 20 瓦),建造成本高达 3.9 亿美元。因此,它尚未广泛应用于大众领域,甚至大多数商业或工业用途也尚未普及。
库兹韦尔建议我们通过观察用 1000 美元能购买多少 cps(每秒计算次数)来思考计算机的发展状态。当这个数字达到人类水平——10 的 16 次方 cps——那就意味着人工通用智能(AGI)可能成为生活中非常真实的一部分。
摩尔定律是一条历史上可靠的法则,它指出全球最大计算能力大约每两年翻一番,这意味着计算机硬件的进步,如同历史上人类整体进步一样,呈指数级增长。观察这与库兹韦尔的 cps/$1,000 指标的关系,我们目前大约处于 10 万亿 cps/$1,000 的水平,正好符合该图表预测的发展轨迹:
因此,如今价值 1000 美元的计算机已经超越了老鼠的大脑,并且达到了人类水平的千分之一。这听起来可能不算什么,但别忘了,在 1985 年我们仅达到人类水平的万亿分之一,1995 年达到十亿分之一,2005 年达到百万分之一。2015 年达到千分之一,意味着我们正稳步迈向 2025 年,届时将有望拥有价格亲民、性能匹敌人类大脑的计算机。
因此,在硬件方面,实现 AGI 所需的原始计算能力在中国已经技术上可行,并且我们将在 10 年内准备好价格合理、广泛普及的 AGI 级别硬件。但仅凭原始计算能力并不能使计算机具备通用智能——接下来的问题是,我们如何将人类水平的智能赋予这些强大的计算能力?
创造 AGI 的第二关键:使其具备智能
这是棘手之处。事实上,没有人真正知道如何让它变得聪明——我们仍在争论如何让计算机达到人类水平的智能,能够识别什么是狗、一个写得怪异的字母 B 以及一部平庸的电影。但市面上有一堆天马行空的策略,终有一天,其中一种会奏效。以下是我遇到的三种最常见策略:
- 抄袭大脑。 这就像科学家们苦思冥想,为什么坐在他们旁边的那个孩子在课堂上如此聪明,考试总是表现优异,尽管他们自己也一直在努力学习,却始终无法达到那个孩子的水平,最后他们决定“去他的,我干脆抄那个孩子的答案算了。”这很合理——我们绞尽脑汁想要造出一台超级复杂的计算机,而每个人的脑袋里恰好就有一个完美的原型。
科学界正致力于逆向工程大脑,以揭示进化如何创造出如此精妙之物——乐观估计,我们有望在 2030 年实现这一目标。一旦成功,我们将洞悉大脑高效运作的所有奥秘,并从中汲取灵感,借鉴其创新。模仿大脑的计算机架构之一便是人工神经网络。它起初是由晶体管“神经元”构成的网络,通过输入输出相互连接,且一无所知——如同婴儿的大脑。其“学习”方式是通过尝试执行任务,比如手写识别,最初,其神经元的激活及对每个字母的猜测完全是随机的。但当被告知答案正确时,促成该答案的激活路径中的晶体管连接会得到加强;若被告知错误,则这些路径的连接会被削弱。经过大量尝试与反馈,网络自行形成了智能神经通路,机器也针对该任务实现了优化。 大脑的学习方式与此类似,但更为复杂。随着我们不断研究大脑,我们正在发现利用神经回路的新颖巧妙方法。
更极端的抄袭策略被称为“全脑仿真”,其目标是将真实大脑切成薄片,逐层扫描,利用软件构建精确的三维重建模型,然后将该模型植入一台强大的计算机中。这样,我们就拥有了一台正式具备大脑所有能力的计算机——它只需学习和收集信息。如果工程师们技术足够精湛,他们能够以极高的精确度模拟真实大脑,使得大脑的完整个性和记忆在上传到计算机后依然完好无损。如果这个大脑属于吉姆,且在他去世前完成上传,那么计算机将作为吉姆(?)苏醒,这将是一个强大的人类级别的人工通用智能(AGI),我们可以着手将吉姆转变为难以想象的超级智能(ASI),他对此可能会非常兴奋。
我们距离实现全脑仿真还有多远?到目前为止,我们才刚刚能够模拟一条 1 毫米长的扁形虫大脑,它总共只有 302 个神经元。而人类大脑则拥有 1000 亿个神经元。如果这让你觉得这是一个无望的项目,请记住指数级进展的力量——既然我们已经攻克了微小蠕虫的大脑,蚂蚁的仿真可能不久后就会实现,接着是老鼠,突然间,这一切将显得更加可行。
- 尝试让进化再次发挥作用,但这次是为了我们。 所以如果我们觉得聪明孩子的考试太难抄袭,我们可以尝试模仿他备考的方式。
我们知道一件事:建造一台与大脑同样强大的计算机是可能的——我们大脑自身的进化就是证明。如果大脑过于复杂,我们无法直接模拟,那么我们可以尝试模拟进化过程。事实上,即使我们能模拟大脑,那可能就像试图通过模仿鸟类的翅膀拍打动作来建造飞机一样——通常,机器的最佳设计方式是采用全新的、以机器为导向的方法,而不是精确地模仿生物学。
那么我们如何通过模拟进化来构建 AGI 呢?这种方法被称为“遗传算法”,其运作方式大致如下:会有一个不断重复的性能评估过程(类似于生物体通过生活“表现”自己,并通过是否成功繁殖来“被评估”)。一组计算机会尝试执行任务,其中最成功的计算机会通过将其各自程序的一半合并在一起,生成一个新的计算机,从而实现“繁殖”。表现较差的则会被淘汰。经过无数次的迭代,这种自然选择过程将产生越来越优秀的计算机。挑战在于创建一个自动化的评估和繁殖循环,使得这一进化过程能够自主运行。
复制进化的缺点在于,进化往往需要数十亿年才能完成某些事情,而我们希望在短短几十年内实现这一目标。
但我们相比进化拥有诸多优势。首先,进化没有预见性且随机进行——它产生的有害突变多于有益突变,而我们可以控制这一过程,使其仅由有益的变异和有针对性的调整驱动。其次,进化并无特定目标,包括智力——有时环境甚至可能不利于更高智力的发展(因为智力消耗大量能量)。相反,我们可以明确引导这一进化过程,以提升智力。第三,为了选择智力,进化必须在其他方面进行一系列创新来促进智力发展——比如改变细胞产生能量的方式——而我们能够消除这些额外负担,转而利用电力等手段。毫无疑问,我们的速度将远超进化——但目前尚不清楚我们能否在进化基础上取得足够进展,使这一策略切实可行。
- 把整个问题交给计算机处理,而不是我们自己。 这是科学家们走投无路时,试图让测试程序自行运行的时候。但这可能是我们目前最有希望的方法。
我们的设想是构建一台计算机,其两大核心技能是进行人工智能研究并将代码修改应用于自身——使其不仅能学习,还能优化自身的架构。我们将教会计算机成为计算机科学家,以便它们能够自主推动自身的发展。而这将成为它们的主要任务——探索如何让自己变得更智能。更多相关内容将在后续展开。
这一切可能很快就会发生
硬件技术的飞速发展与软件领域的创新实验正同步进行,AGI(人工通用智能)可能会迅速且出人意料地逼近我们,这主要有两个原因:
- 指数增长是迅猛的,看似蜗牛般的进步速度可能迅速飙升——这张 GIF 很好地诠释了这一概念:
- 在软件领域,进展看似缓慢,但一次顿悟便能瞬间改变发展的速度(就像在人类认为宇宙是地心说的时代,科学难以解释宇宙的运作方式,而日心说的发现突然让一切变得简单得多)。或者,对于像能够自我改进的计算机这样的东西,我们可能看似遥不可及,但实际上只需对系统进行一次调整,它就能变得高效千倍,并迅速跃升至人类智能的水平。
从 AGI 到 ASI 的演进之路
在某个时刻,我们将实现 AGI——具备人类水平通用智能的计算机。届时,人类与计算机将平等共处。
哦,其实一点也不。
关键在于,拥有与人类相同智能水平和计算能力的 AGI 仍然会具有显著优势。例如:
硬件:
- 速度。大脑神经元的最大频率约为 200 赫兹,而当今的微处理器(远低于我们实现 AGI 时的速度)运行在 2 吉赫兹,比我们的神经元快 1000 万倍。大脑内部的通信速度大约为 120 米/秒,与计算机以光速进行光学通信的能力相比,显得极为逊色。
- 大小与存储。大脑的大小受限于我们头骨的形状,而且无论如何也无法变得更大,否则 120 米/秒的内部通信速度将导致信息在大脑结构间传递耗时过长。计算机则能够扩展至任何物理尺寸,从而部署更多的硬件资源,拥有更大的工作内存(RAM),以及长期记忆(硬盘存储),其容量和精确度都远超人类大脑。
- 可靠性与耐久性。不仅仅是计算机的记忆会更加精确。计算机晶体管比生物神经元更为准确,且不易退化(即便发生问题,也能进行修复或更换)。人脑容易疲劳,而计算机可以全天候不间断地以最佳性能运行。
软件:
- 可编辑性、可升级性以及更广泛的可能性。与人类大脑不同,计算机软件可以接收更新和修复,并且可以轻松进行实验。升级还可以扩展到人类大脑薄弱的领域。人类的视觉软件极为先进,而其复杂的工程能力却相当低端。计算机可以在视觉软件上与人类匹敌,同时也能在工程及其他任何领域实现同等优化。
- 集体能力。人类在构建庞大的集体智慧方面远超其他物种。从语言的发展和大规模密集社区的形成开始,通过书写和印刷的发明不断进步,如今借助互联网等工具进一步强化,人类的集体智慧是我们能够遥遥领先于其他物种的主要原因之一。而计算机在这方面将比我们做得更好。一个运行特定程序的全球性人工智能网络可以定期自我同步,使得任何一台计算机学到的内容都能立即上传到所有其他计算机。这个群体还可以作为一个整体追求一个目标,因为它们不会像人类那样存在异议、动机和私心。
人工智能(AI)很可能通过自我改进的编程达到通用人工智能(AGI),它不会将“人类水平智能”视为重要的里程碑——这只是从我们的角度来看的一个相关标志——并且没有任何理由在我们的水平上“停止”。考虑到即使是与人类智能相当的 AGI 也具备超越我们的优势,很明显它只会短暂地触及人类智能,然后迅速迈向超越人类智能的领域。
当这种情况发生时,可能会让我们震惊不已。原因在于,从我们的角度来看,A) 尽管不同种类动物的智力水平各异,但我们对任何动物智力的主要认知是它们远低于我们,B) 我们认为最聪明的人类比最愚笨的人类要聪明得多。大致如下:
随着人工智能的智能水平不断攀升,接近人类,我们会视其为一个越来越聪明的动物。然后,当它达到人类智能的最低门槛——尼克·博斯特罗姆称之为“村里的傻瓜”——我们会感叹:“哇,它就像个笨拙的人类,真可爱!”但关键在于,在智能的广阔光谱中,所有人类,从村里的傻瓜到爱因斯坦,都处于一个非常狭窄的区间内。因此,一旦人工智能触及“村里的傻瓜”水平并被认定为通用人工智能(AGI),它很快就会超越爱因斯坦,而我们甚至来不及反应:
然后呢…接下来会发生什么?
智能爆炸
希望你已经享受了正常的时光,因为接下来这个话题将变得异常且令人恐惧,而且从此刻起,它将一直保持这种状态。在此,我想稍作停顿,提醒你,我将要说的每一件事都是真实的——真实的科学,以及来自众多最受尊敬的思考者和科学家对未来的真实预测。请始终牢记这一点。
无论如何,正如我上面所说,我们目前大多数实现通用人工智能(AGI)的模型都涉及 AI 通过自我改进达到这一目标。而一旦达到 AGI,即使是那些通过不涉及自我改进的方法形成和成长的系统,如果它们愿意,现在也足够智能,可以开始自我改进。
这就是我们触及到一个深刻概念的地方:递归自我改进。它的运作方式如下——
某个层次的 AI 系统——假设相当于人类村庄中的愚者——被编程以提升自身智能为目标。一旦它实现了这一目标,就会变得更聪明——或许此时已达到了爱因斯坦的水平——于是,当它继续致力于智能提升时,凭借爱因斯坦级别的智慧,它能够更轻松地取得进展,实现更大的飞跃。这些飞跃使其远超任何人类,从而能够实现更为巨大的跨越。随着飞跃的幅度不断增大且速度加快,AGI(人工通用智能)在智能上迅速攀升,很快便达到了 ASI(人工超级智能)系统的超智能水平。这一过程被称为“智能爆炸”,它是“加速回报定律”的终极例证。
关于 AI 何时能达到人类水平的通用智能存在一些争议。一项针对数百名科学家的调查显示,他们认为我们更有可能在 2040 年 12 月之前实现 AGI(人工通用智能)——这距离现在只有 25 年,听起来似乎并不遥远,但考虑到该领域的许多思想家认为从 AGI 到 ASI(人工超级智能)的进展可能会非常迅速。就像——这种情况可能会发生:
首个 AI 系统花费数十年时间才达到低水平的通用智能,但最终实现了。这台计算机能够像四岁儿童一样理解周围的世界。突然之间,在达到这一里程碑后的一小时内,该系统提出了统一广义相对论和量子力学的宏大物理学理论,这是人类至今未能明确完成的任务。90 分钟后,该 AI 已进化为 ASI,其智能水平是人类的 17 万倍。
那种程度的超级智能,我们根本无法理解,就像大黄蜂无法理解凯恩斯经济学一样。在我们的世界里,聪明意味着 130 的智商,而愚蠢意味着 85 的智商——我们甚至没有一个词来形容 12,952 的智商。
我们所知道的是,人类在地球上的绝对统治地位表明了一个明确的规则:智慧带来力量。这意味着,当我们创造出人工超级智能(ASI)时,它将成为地球生命史上最强大的存在,所有生物,包括人类,都将完全受其摆布——而这可能在未来的几十年内发生。
如果我们渺小的大脑都能发明出 WiFi,那么比我们聪明 100 倍、1000 倍甚至 10 亿倍的存在,应该能够轻而易举地随心所欲、随时随刻控制世界上每一个原子的位置——我们所认为的魔法,以及我们想象中至高无上的神所拥有的力量,对于超级人工智能(ASI)来说,就像我们打开电灯开关一样平常。开发出逆转人类衰老的技术,治愈疾病和饥饿,甚至战胜死亡,重新编程天气以保护地球生命的未来——这一切突然之间都成为可能。同样可能的,是地球上所有生命的瞬间终结。就我们而言,如果超级人工智能诞生,地球上便出现了一位全能的神——而对我们来说,最关键的问题是:
它会是一个善良的上帝吗?
这是本文第二部分要讨论的主题。