界面新聞?dòng)浾?| 李彪
界面新聞編輯 | 宋佳楠
年初發(fā)布第一代世界模型Genie后,DeepMind又在年末帶著升級(jí)版新模型登場(chǎng)了。
美國當(dāng)?shù)貢r(shí)間12月4日,谷歌旗下人工智能研究機(jī)構(gòu)DeepMind推出新模型Genie 2。作為Genie模型的升級(jí)版,Genie2同樣是一款世界模型(AI行業(yè)對(duì)理解和模擬現(xiàn)實(shí)世界生成式AI模型的統(tǒng)稱),升級(jí)后其在模擬復(fù)雜環(huán)境方面展現(xiàn)出更加強(qiáng)大的實(shí)力。
據(jù)DeepMind論文介紹,新模型最大的特色是支持通過單張圖片和文字描述生成3D世界,生成時(shí)長(zhǎng)可持續(xù)一分鐘左右,但多數(shù)情況下維持在10到20秒之間。
DeepMind在論文中附帶了許多段演示視頻,展示用戶與Genie 2的互動(dòng)過程。模型會(huì)根據(jù)文字描述生成初始圖片,再基于這張圖片創(chuàng)造出一個(gè)完整的3D互動(dòng)世界。用戶可以通過操縱鍵盤鼠標(biāo)與其互動(dòng),而Genie 2會(huì)實(shí)時(shí)模擬生成你看到的每一幀畫面。
生成的3D世界支持用戶從不同的視角互動(dòng),如第一人稱視角和等距視角,以還原真實(shí)世界互動(dòng)的既視感。
從演示視頻中可以看出,模型生成的3D世界中的許多細(xì)節(jié)都在模擬真實(shí)世界,例如模擬物體交互、復(fù)雜角色動(dòng)畫、物理現(xiàn)象、照明效果、反射效果及NPC設(shè)計(jì)等等。
最為重要的是,這款世界模型還可以“繼續(xù)成長(zhǎng)”變得更強(qiáng)大。論文介紹,推出Genie 2的主要目的之一是為通用AI智能體提供無限多樣的動(dòng)態(tài)場(chǎng)景,用于訓(xùn)練和評(píng)估。經(jīng)過循環(huán)往復(fù)的大規(guī)模訓(xùn)練,AI也從模擬真實(shí)世界無限接近成為一個(gè)可以理解真實(shí)世界的“智能體”。
具備以上一系列強(qiáng)大功能后,Genie 2模型有望在游戲領(lǐng)域先找到一番“用武之地”。
DeepMind團(tuán)隊(duì)在論文中特別指出,Genie 2能按照用戶需求生成豐富多樣的3D游戲環(huán)境,如果未來用于游戲開發(fā)中任務(wù)場(chǎng)景設(shè)計(jì),或可徹底改變游戲行業(yè),特別會(huì)給《我的世界》這類開放世界游戲的創(chuàng)作帶來“一場(chǎng)技術(shù)革命”。