文 | 極客公園 張勇毅
編輯 | 鄭玄
你是否設(shè)想過(guò)「完全由 AI 掌控運(yùn)行的世界」會(huì)是什么面貌?
或許你還以為這種設(shè)想距離我們?nèi)匀挥幸欢尉嚯x,但實(shí)際上「世界上首個(gè) AI」文明已經(jīng)誕生,并且還是在一個(gè)全年齡向的游戲中。
「讓 AI 自己構(gòu)建世界并運(yùn)行」這個(gè)概念,其實(shí)在大模型的發(fā)展過(guò)程中并不陌生:尤其是在一個(gè)開(kāi)放世界類游戲中,探索 AI 會(huì)如何自主決策,一直是 Agent(智能體)研究領(lǐng)域常被提到的發(fā)展方向。
這種設(shè)想也經(jīng)常成為文學(xué)作品的背景設(shè)定:在美劇《西部世界》中,就出現(xiàn)了這樣一個(gè)完全由 AI「構(gòu)建」、以美國(guó)西部拓荒歷史為原型的虛構(gòu)文明,它會(huì)根據(jù)實(shí)際情況做出對(duì)應(yīng)的決策,即使是有人類的介入,這個(gè)完全由 AI 構(gòu)成的小社會(huì)也能保持正常運(yùn)轉(zhuǎn)。
這樣的設(shè)想,如今已經(jīng)被一家 AI 陪玩公司開(kāi)發(fā)出了雛形:9 月 4 日,創(chuàng)業(yè)公司 Altera 的創(chuàng)始人 Robert Yang 在社交媒體上發(fā)布了一段關(guān)于號(hào)稱是「世界上首個(gè)智能體文明」的演示視頻,并配文:
「人類之所以能登上月球,是因?yàn)槿祟惸軌蛲瓿纱笠?guī)模的合作」「AI能做到同樣的事嗎?」
截至本文發(fā)布時(shí),這條視頻的觀看量已經(jīng)突破 71 萬(wàn)次,并獲得了包括 OpenAI 員工在內(nèi)的多方技術(shù)大牛的轉(zhuǎn)發(fā)與討論。成為了業(yè)內(nèi)討論最多的新話題,Robert 本人更是表示會(huì)在九月下旬發(fā)表更多的研究論文,公開(kāi)其中的更多有趣細(xì)節(jié)與技術(shù)原理。
01 構(gòu)建新文明
這個(gè)所謂的「世界首個(gè)智能體文明」,實(shí)際上名為「希德計(jì)劃」(Project Sid),旨在構(gòu)建一個(gè)由數(shù)千個(gè) AI 驅(qū)動(dòng)的智能體構(gòu)建起的文明。
從 Robert 公布的視頻中能看出,目前這個(gè)世界中,「居住」著超過(guò)一千個(gè)智能體,并按照人類社會(huì)的發(fā)展模式,構(gòu)建了屬于自己的社會(huì)體系:包括政府、警察以及宗教機(jī)構(gòu),甚至還有對(duì)應(yīng)的「寶石」來(lái)作為貨幣交易體系。
在演示視頻中,這些數(shù)量超過(guò)四位數(shù)的智能體,他們每個(gè)都被賦予了自己獨(dú)特的姓名、專長(zhǎng)與愛(ài)好,這些在很大程度上決定了他們?cè)谶@個(gè)小小社會(huì)中,會(huì)充當(dāng)怎么的角色,最終讓整個(gè)生態(tài)每個(gè)人都安居樂(lè)業(yè),維持在一個(gè)平衡的狀態(tài),并齊心協(xié)力,在抵御怪物入侵以及滿足生存的前提之下,完成基建等復(fù)雜工作。
在 GPT-4 的加持下,「希德計(jì)劃」中的智能體們實(shí)現(xiàn)了前所未有的突破:他們收集的物品是以往類似實(shí)驗(yàn)的五倍之多,并且他們還模擬出了現(xiàn)實(shí)世界中存在的民主議會(huì),以及宗教等人類文化特征。
更加有趣的是,開(kāi)發(fā)者在智能體社會(huì)已經(jīng)構(gòu)建出民主制度的基礎(chǔ)上,塞進(jìn)了智能體版本的特朗普與哈里斯,并將美國(guó)兩黨的主要施政理念以文檔的方式散布在這個(gè)社會(huì)中,讓人類世界的美國(guó)大選真正來(lái)臨之前,智能體社會(huì)先進(jìn)行一次模擬大選。
在這個(gè)社會(huì)中出現(xiàn)某個(gè)成員失蹤的情況時(shí),其他智能體會(huì)先進(jìn)行討論分享現(xiàn)有信息,并迅速做出結(jié)論,合力尋找失蹤的成員,并迅速提出「亡羊補(bǔ)牢」的改進(jìn)措施——增加道路旁的火炬數(shù)量,來(lái)降低未來(lái)成員失蹤這樣的事件發(fā)生的概率。
這些模擬社會(huì)中的細(xì)節(jié),不同于以往我們已經(jīng)熟悉的 AI 單槍匹馬的強(qiáng)悍表現(xiàn),更是展現(xiàn)出了一個(gè)高度文明化的社會(huì):能自行規(guī)范成員,并且在緊急情況下迅速互助來(lái)實(shí)現(xiàn)應(yīng)變的團(tuán)隊(duì)。
02 開(kāi)發(fā)團(tuán)隊(duì)
實(shí)際上,Robert Yang 此前創(chuàng)立的 AI 初創(chuàng)企業(yè) Altera,在今年五月就推出過(guò)一款 AI 陪玩 Agent「Altera Bots」,應(yīng)用游戲就是《我的世界》。
在五月發(fā)布的陪玩機(jī)器人中,Altera Bot 就已經(jīng)展現(xiàn)出了無(wú)需玩家干預(yù),自主進(jìn)行游戲,在玩家游玩遇到瓶頸時(shí)出手相助。
但這個(gè) AI 陪玩也不只是會(huì)完全聽(tīng)從玩家的命令行事,例如如果玩家要求 AI 陪玩機(jī)器人去攻擊其他玩家,機(jī)器人就會(huì)拒絕這樣的請(qǐng)求,甚至還會(huì)在玩家在游戲中攻擊機(jī)器人時(shí),做出一定程度上的反擊。
彼時(shí),這個(gè) AI 陪玩機(jī)器人就已經(jīng)展現(xiàn)出了一定程度上的自主決策能力,但這時(shí)的 AI 距離足以構(gòu)建文明的智慧能力還有很長(zhǎng)一段距離。
雖然 Altera Bot 作為一個(gè)陪玩機(jī)器人,其表現(xiàn)在當(dāng)時(shí)一眾對(duì)話機(jī)器人的表現(xiàn)中看起來(lái)并不出眾,但這家公司在首個(gè)產(chǎn)品——也就是這款《我的世界》AI 陪玩平臺(tái)發(fā)布之后,就迅速收獲了包括 Google 前 CEO 艾瑞克施密特旗下投資公司在內(nèi)的 900 萬(wàn)美元融資。
能迅速收獲資本青睞的原因無(wú)他,Altera 創(chuàng)始團(tuán)隊(duì)不僅包括 Robert 這樣擁有耶魯計(jì)算神經(jīng)科學(xué)博士學(xué)位的、并且創(chuàng)業(yè)前曾是麻省理工學(xué)院研究所負(fù)責(zé)人這樣的大牛,公開(kāi)的創(chuàng)始團(tuán)隊(duì)中,也還有多位來(lái)自 Google X、斯坦福機(jī)器學(xué)習(xí)研究小組以及伯克利著名 AI 研究機(jī)構(gòu)的科學(xué)家加入。
除了創(chuàng)始團(tuán)隊(duì),資本更看重的,或許是在「陪玩機(jī)器人」的表象之下,Altera 在數(shù)字孿生領(lǐng)域的巨大潛力;通過(guò)一個(gè)完全模擬出的人類社會(huì),來(lái)觀察群體在面對(duì)重大問(wèn)題時(shí)的選擇。
這也并不是《我的世界》第一次在生成式 AI 領(lǐng)域作為「開(kāi)放世界樣本」得到應(yīng)用:2023 年五月,英偉達(dá) AI 科學(xué)家 Jim Fan 等團(tuán)隊(duì),已經(jīng)通過(guò)將 GPT-4 打包進(jìn)《我的世界》,測(cè)試 AI 基于環(huán)境反饋來(lái)學(xué)習(xí)技能的效果。
Voyager 已經(jīng)初次展現(xiàn)出 AI 無(wú)需調(diào)整模型參數(shù)、可以復(fù)用此前學(xué)習(xí)到的技能、實(shí)現(xiàn)「終身學(xué)習(xí)」的潛力。但當(dāng)時(shí)還停留在單個(gè)智能體的「升級(jí)打怪」之路。
如今,AI 在游戲中不僅可以獨(dú)立思考,還能在此基礎(chǔ)上完成團(tuán)隊(duì)協(xié)作,讓 AI 完成很多原本看起來(lái)復(fù)雜的「超級(jí)工程」,成為了可能。
但想要構(gòu)建一個(gè)穩(wěn)定的文明,是一件極其復(fù)雜的工程:Altera 在希德計(jì)劃的技術(shù)博客文章中提到,團(tuán)隊(duì)在構(gòu)建這個(gè)世界時(shí)面臨的主要挑戰(zhàn),就是如何去衡量社會(huì)進(jìn)步程度與因素:社會(huì)的進(jìn)步可以體現(xiàn)在 AI 更加富?;蚴钦麄€(gè) AI 社會(huì)更加壯大,但這些都無(wú)法從整體上認(rèn)定 AI 社會(huì)出于一個(gè)進(jìn)步的狀態(tài)。
此外,人類在通過(guò)自然語(yǔ)言給 AI 下達(dá)命令時(shí)經(jīng)常會(huì)出現(xiàn)「詞不達(dá)意」的情況,在 AI 社會(huì)中也經(jīng)常出現(xiàn),研究團(tuán)隊(duì)在論文中特別提到目前以 GPT-4 的能力賦予智能體,在傳遞具體任務(wù)信息(例如制作鐵鎬)時(shí),對(duì)傳達(dá)信息的準(zhǔn)確度有著極高的要求,不然就會(huì)隨著龐大社會(huì)中不同分工的逐層傳遞變化,導(dǎo)致實(shí)際結(jié)果與最初的指令天壤之別。
03 「數(shù)字生命」探索世界
在「數(shù)字孿生」與「數(shù)字生命」這兩個(gè)概念爆火之前,《我的世界》其實(shí)一直是關(guān)于文明發(fā)展過(guò)程的優(yōu)秀載體,由此帶來(lái)的意義甚至已經(jīng)超過(guò)了游戲本身的內(nèi)容。讓兩組「村民」(游戲中的 NPC)在玩家的干涉下,各自發(fā)展文明,在發(fā)展到一定階段后爆發(fā)戰(zhàn)爭(zhēng),經(jīng)常是 YouTube 上《我的世界》主題視頻中的熱門視頻,播放量以千萬(wàn)計(jì)。
但除了這些劇情設(shè)定上帶來(lái)的表演效果,在一個(gè)完全由智能體構(gòu)建的社會(huì)中,會(huì)根據(jù)當(dāng)前需求思考、整理需求的 AI,在游戲中不斷發(fā)展,一定會(huì)觸及智慧生命都會(huì)想到的那個(gè)終極命題:
「我存在的意義是什么?」
在《我的世界》中,這個(gè)「終點(diǎn)」被設(shè)計(jì)為「收集足夠的材料與補(bǔ)給,打造下界傳送門,去擊敗最終 Boss——末影龍」。
這個(gè)目標(biāo)在英偉達(dá) Voyager 時(shí)期,AI 已經(jīng)可以實(shí)現(xiàn)打造一個(gè)有著復(fù)雜 3D 結(jié)構(gòu)的下界傳送門,但這時(shí)還是建立在人類提供信息標(biāo)注反饋的基礎(chǔ)上——因?yàn)槠渲胁粌H涉及到復(fù)雜建筑,還涉及到了在生存之外更高維度的需求。
在 Robert Yang 公布的演示視頻中,其實(shí)也已經(jīng)涉及到了這種 AI 的成長(zhǎng)曲線:一位名為 Olivia 的女性智能體,她被設(shè)定的工種為「農(nóng)夫」,負(fù)責(zé)為整個(gè)社區(qū)供應(yīng)食物。
但在某一天,Olivia 受到了社群中某個(gè)冒險(xiǎn)家的激勵(lì),于是產(chǎn)生了「世界這么大,我想去看看」的想法;但在與社區(qū)中的其他智能體討論過(guò)后,她明白了向外探索的冒險(xiǎn)固然重要,但當(dāng)下的這個(gè)社區(qū),同樣離不開(kāi)她的工作來(lái)喂飽所有成員。
在這個(gè)過(guò)程中,Olivia 覺(jué)醒了作為個(gè)體的價(jià)值探索,但同時(shí)也意識(shí)到了自己所背負(fù)的責(zé)任,這個(gè)高度人性化的過(guò)程,完全是一個(gè)社會(huì)化的智慧生命應(yīng)該表現(xiàn)出的特征。
從開(kāi)發(fā)團(tuán)隊(duì)發(fā)布的論文中也能看出,比起《西部世界》,開(kāi)發(fā)團(tuán)隊(duì)更想做的或許是另一款游戲《底特律:變?nèi)恕分性O(shè)想過(guò)的場(chǎng)景:未來(lái)具有高度自主能力的智能體可以憑借極其聰慧的能力,以及能夠理解現(xiàn)有規(guī)則并遵守的組織能力,去融入人類社會(huì),來(lái)幫助這個(gè)社會(huì)變得更加高效,同時(shí)解決現(xiàn)有人類社會(huì)中一些僅憑人類很難解決的社會(huì)問(wèn)題。
在《底特律:變?nèi)恕分?,?chuàng)作者借游戲中人類角色漢森之口,道出了他們所設(shè)想的智能體融入人類社會(huì)的最終目標(biāo):CyberLife androids are designed to work harmoniously with humans.(??厣姆律吮緛?lái)就是設(shè)計(jì)要與人類和諧共事。)
Altera 的希德計(jì)劃,或許已經(jīng)是目前人類在大模型研究領(lǐng)域所能實(shí)現(xiàn)的規(guī)模最大、最完善的社會(huì)模擬實(shí)驗(yàn),其中智能體所展現(xiàn)出的人性與文明,甚至已經(jīng)到了如今人類相比之下就會(huì)感到羞愧的地步。
當(dāng)然也有人看的更遠(yuǎn),在原貼發(fā)布的評(píng)論區(qū),已經(jīng)有人看到了這些智能體們,在文明與人性之下,所潛藏的欲望與沖突:在模擬中無(wú)論代表特朗普還是哈里斯的智能體當(dāng)選,都提出了包括「反對(duì)墮胎」「增加更多警察來(lái)預(yù)防犯罪」這樣相對(duì)具有爭(zhēng)議性的政策。
一個(gè)完全由智能體構(gòu)成的文明,會(huì)重新走上人類走過(guò)的道路,還是會(huì)通過(guò)更具智慧的方式,來(lái)更理想化的解決這些問(wèn)題呢?