文|略大參考 小葵 尹凱
編輯|原野
ChatGPT 會(huì)成為AI大模型的“iPhone 時(shí)刻”嗎?
在這款改變了全球AI行業(yè)進(jìn)展的大模型上線一周年之后,答案顯然更加明確。GPT數(shù)次進(jìn)化迭代,大模型浪潮席卷全球,AGI儼然有引導(dǎo)第四次工業(yè)革命之勢(shì),也驗(yàn)證了OpenAI首席科學(xué)家伊利亞的那句話:這是傾盆大雨前的一場(chǎng)雨,是一個(gè)分水嶺。
更深入更細(xì)微的變化還在繼續(xù)。
“在未來兩三年內(nèi),我們的工作方式、生活方式會(huì)有天翻地覆的變化?!卑俅ㄖ悄軇?chuàng)始人、CEO王小川在12月1日的2023騰訊ConTech大會(huì)中談到。大會(huì)上,他與長(zhǎng)江商學(xué)院教授、數(shù)字化轉(zhuǎn)型中心主任孫天澍,以及復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院教授、Moss系統(tǒng)負(fù)責(zé)人邱錫鵬,探討了AI將在接下來的20年里如何重塑各個(gè)行業(yè),其中,互聯(lián)網(wǎng)大廠與創(chuàng)業(yè)公司又各自扮演什么角色。
01、變化
從只能處理文字信息的網(wǎng)頁端應(yīng)用,到可以同時(shí)處理文字、語音和圖像信息的超級(jí)應(yīng)用,ChatGPT只用了一年。期間,出于對(duì)其進(jìn)化過快的擔(dān)憂,包括馬斯克在內(nèi)的科技界大佬曾經(jīng)聯(lián)名呼吁,要緩一緩。
但大模型的熱潮已經(jīng)勢(shì)不可擋。OpenAI已經(jīng)從最初的非盈利機(jī)構(gòu),變成估值900億美元的超級(jí)獨(dú)角獸。全球幾乎所有的大科技公司都發(fā)布了自己的大語言模型,從谷歌、Meta到國(guó)內(nèi)的騰訊、阿里、百度、華為等。
于是,關(guān)于大模型的產(chǎn)業(yè)機(jī)會(huì)、技術(shù)突破和未來展望,就成為上述三位嘉賓在2023騰訊ConTech大會(huì)探討的重點(diǎn)。
比如,大模型浪潮究竟是互聯(lián)網(wǎng)大廠的機(jī)會(huì),還是新一代創(chuàng)業(yè)公司的機(jī)會(huì)?
王小川沒有作出“二選一”的回答。在他看來,大模型行業(yè)里,大創(chuàng)新靠小廠,小創(chuàng)新靠大廠。因?yàn)榇髲S本身會(huì)擁有自己的大模型,只要增加1%就會(huì)帶來巨大收益。創(chuàng)業(yè)公司死亡率更高,也更可能帶來更大的創(chuàng)新。
回到問題本身就是,當(dāng)大模型推動(dòng)大的時(shí)代變遷,人類從信息時(shí)代走向智能時(shí)代,會(huì)有很多新的公司誕生,空間很大。
具體落到大模型在消費(fèi)互聯(lián)網(wǎng)C端的應(yīng)用,王小川比較看好它在智能助理和娛樂游戲內(nèi)容方面的前景。比如,成為人類的私人老師、醫(yī)生和律師等,或者在娛樂游戲中搭建更加高級(jí)的“太虛幻境”,因?yàn)榇竽P筒捎玫氖堑讓诱Z言引擎,能構(gòu)造出世界觀和真實(shí)世界中的物理邏輯、社會(huì)文化邏輯等。
在技術(shù)層面,不管是OpenAI正在籌備的GPT商店,還是Facebook或者百川這類技術(shù)公司陸續(xù)推出的開源模型,開放,都在成為更加明朗的趨勢(shì)。
由此可能帶來的改變是大模型的平民化。邱錫鵬提到技術(shù)棧方面的體現(xiàn),即,圍繞某個(gè)大模型形成比較大的生態(tài)圈,提供好的個(gè)性化、定制化服務(wù)。不過,這需要解決計(jì)算成本的問題——這也是大模型變成人類助手的巨大阻礙。
因此,在他看來,進(jìn)一步壓縮大模型,甚至創(chuàng)造出新的架構(gòu),降低計(jì)算成本,讓所有人都能用得起。大模型“平民化”的過程,也蘊(yùn)含著大量機(jī)會(huì)。
不過,很顯然,不是所有人和公司都能在合適的時(shí)機(jī)、抓住對(duì)的機(jī)會(huì)。
根據(jù)王小川的觀察,大模型目前處于泡沫期,一些擁有技術(shù)力量的公司傾向于訓(xùn)練自己的大模型,因此導(dǎo)致了百模大戰(zhàn)、千模大戰(zhàn)。數(shù)據(jù)顯示,到2023年7月時(shí),國(guó)內(nèi)大模型數(shù)量達(dá)到130個(gè),已經(jīng)超過美國(guó)的114個(gè)。到年底,前者又更新到了238個(gè)。
但本質(zhì)上,這是一種焦慮:個(gè)人怕失業(yè),企業(yè)怕掉隊(duì)。在王小川看來,現(xiàn)在很多算力是浪費(fèi)的。當(dāng)行業(yè)進(jìn)入成熟期,少量企業(yè)會(huì)擁有自己的數(shù)據(jù)與場(chǎng)景,甚至訓(xùn)練出自己的模型去賦能行業(yè),但多數(shù)企業(yè)通過調(diào)用就足夠了。
在現(xiàn)階段,他的建議是:克制欲望,不要著急訓(xùn)練自己的模型,而是先把市面上已有的模型用好,通過產(chǎn)品和市場(chǎng),先驗(yàn)證自己的判斷,把第一步走好。
不過,區(qū)別于AI技術(shù)在過去幾十年里的任何一次爆發(fā),人類對(duì)于AGI的態(tài)度更加熱烈,也更加謹(jǐn)慎。根據(jù)OpenAI首席科學(xué)家伊利亞的說法,這是因?yàn)锳GI區(qū)別于人類迄今為止創(chuàng)造的所有東西,它具有自己的目標(biāo),完全自主。
AGI自身,以及人類圍繞AI技術(shù)的研究的飛速迭代,決定了AI行業(yè)的這場(chǎng)狂飆,也決定了,身處其中之人,必須時(shí)刻進(jìn)行自我迭代。
王小川在ConTech大會(huì)中談到了自己的觀念變化。
他原本有個(gè)觀點(diǎn):理想上慢半步,落地上快一步。相比技術(shù)科研,中國(guó)的優(yōu)勢(shì)可能在應(yīng)用層面。但今年6月去美國(guó)與大模型同行們交流后,他改變了,想要:理想上慢一步,落地上快三步。
一方面,擁有7年積累的OpenAI在技術(shù)層面已經(jīng)領(lǐng)先太多。比如OpenAI現(xiàn)在正在進(jìn)行的研究是,嘗試把1000萬顆GPU連在一起訓(xùn)練一個(gè)大規(guī)模的模型,而國(guó)內(nèi)現(xiàn)在還在4000顆GPU對(duì)標(biāo)GPT-3.5的階段。不過,在應(yīng)用層面,中國(guó)互聯(lián)網(wǎng)的產(chǎn)品體驗(yàn)遠(yuǎn)強(qiáng)于美國(guó),移動(dòng)互聯(lián)網(wǎng)時(shí)代也培養(yǎng)了大量?jī)?yōu)秀的產(chǎn)品經(jīng)理,這些都是優(yōu)勢(shì)。
一句話就是:更加徹底地?fù)P長(zhǎng)避短。
02、狂飆
王小川的觀點(diǎn),或許也是多數(shù)大模型創(chuàng)業(yè)者的心態(tài)縮影:在月亮與六便士之間,優(yōu)先選擇后者。
畢竟,先活下來,才有機(jī)會(huì)參與到后面的故事。
蘋果公司在移動(dòng)互聯(lián)網(wǎng)時(shí)代建立起來的供應(yīng)鏈與生態(tài)王國(guó),成為很多還在路上的大模型中國(guó)創(chuàng)業(yè)者的“燈塔”。僅僅在A股,蘋果產(chǎn)業(yè)鏈上市公司就有118家,“蘋果吃肉,供應(yīng)商喝湯”的說法廣為人知。更不用說,那些通過做一款A(yù)PP而改變?nèi)松壽E的海量創(chuàng)業(yè)者們。
目前來看,Open AI很可能成為新時(shí)代里的蘋果公司——就連創(chuàng)始人被驅(qū)逐出董事會(huì)再回歸的橋段,都如此相似。就算它無法復(fù)制蘋果的成功,微軟和谷歌也足夠有野心。
在中國(guó)創(chuàng)業(yè)圈,AI狂飆的劇情正在上演。
今年以來,多家大模型初創(chuàng)公司拿到融資,企名片數(shù)據(jù)顯示,今年中國(guó)AI領(lǐng)域融資214億元,百川智能、Minimax和智譜AI三家公司在資本市場(chǎng)尤為受歡迎,融資額占比超過30%,基本形成第一梯隊(duì)。
圖:人工智能領(lǐng)域該周內(nèi)融資6起,融資金額21.73億元。其中,在10月17日,百川智能完成3億美元的A1輪戰(zhàn)略融資。
以成立于今年3月的百川智能為例,它在天使輪拿到5000萬美元,AI輪拿到3億美元,參與方包括阿里、騰訊、小米和多家頭部投資機(jī)構(gòu)。
陸奇創(chuàng)辦的奇績(jī)論壇,成為這波AI浪潮的縮影。根據(jù)《中國(guó)企業(yè)家》報(bào)道,在今年的秋季路演日上,67家創(chuàng)業(yè)公司參與,其中51家為人工智能領(lǐng)域。更早些時(shí)候的春季路演日,人工智能和大模型相關(guān)創(chuàng)業(yè)項(xiàng)目為82個(gè),超過總項(xiàng)目的一半。
更多明星人物在AI大潮中變得炙手可熱。比如創(chuàng)立光年之外的王慧文、創(chuàng)立百川智能的王小川。他們此前在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代的履歷已經(jīng)足夠光鮮,唯一的缺憾就是,尚未獨(dú)自站在舞臺(tái)中央。
如今,AI讓一切成為可能。
王慧文曾經(jīng)在接受采訪時(shí)提到美國(guó)投資人埃拉德.吉爾的觀點(diǎn):在部分科技浪潮中,所有的價(jià)值都可以由初創(chuàng)企業(yè)捕獲,而在另外的浪潮中,大部分價(jià)值會(huì)歸成熟企業(yè)所有,或者會(huì)在初創(chuàng)企業(yè)和成熟企業(yè)之間分配。在王慧文看來,AGI浪潮屬于后者。因?yàn)榇竽P偷募夹g(shù)跟過去差異極大,市場(chǎng)具有不可預(yù)測(cè)性,創(chuàng)業(yè)公司就有了發(fā)展空間。
不過,類似這樣的觀點(diǎn),還有待時(shí)間去驗(yàn)證。
創(chuàng)業(yè)者紛涌入局,實(shí)力更雄厚的大公司們,自然也不會(huì)缺席。
場(chǎng)景、數(shù)據(jù)、模型和算力,共同構(gòu)成了大模型的四要素,這也意味著門檻——?jiǎng)?chuàng)業(yè)公司或許能擅長(zhǎng)其中的一項(xiàng)或者幾項(xiàng),但想把它們盡可能多地集齊,顯然還是大公司更有優(yōu)勢(shì)。根本上,這是關(guān)于科技的硬較量,需要大量資金與高端人才的投入。
整體來看,大模型在國(guó)內(nèi)經(jīng)歷了三個(gè)階段:今年3月起,百度、阿里、華為、騰訊、360等大廠陸續(xù)發(fā)布大模型;5月起,包括商湯在內(nèi)的AI 1.0公司,以及知乎等中小互聯(lián)網(wǎng)公司跟進(jìn);10月起,一批大模型進(jìn)行迭代,部分國(guó)產(chǎn)大模型宣布開源。
至少到現(xiàn)在,大廠與創(chuàng)業(yè)公司們還沒有形成涇渭分明的敵對(duì)陣營(yíng)。狩獵、絞殺和反抗的戲碼,還沒有拿到出場(chǎng)的指令。更多時(shí)候,以及接下來的很長(zhǎng)時(shí)間里,他們都需要彼此借力,爭(zhēng)取在國(guó)內(nèi)形成健康繁榮、且能持續(xù)相當(dāng)時(shí)間的AI生態(tài)。
不過,人們?cè)诂F(xiàn)實(shí)中感受到大模型賽道狂飆的影響,或許不需要等待太久。
在2023騰訊ConTech大會(huì)中,王小川給出的答案是“未來兩三年”。他借用了孫正義的觀點(diǎn),“會(huì)用AI和不會(huì)用AI的人就像人和猴子的區(qū)別一樣”,他相信,人們的工作和生活方式很快會(huì)因?yàn)锳I而發(fā)生巨變。
變化帶來機(jī)遇,也帶來希望。
財(cái)經(jīng)作家吳曉波在《激蕩三十年》中寫道:“這是最好的時(shí)代,這是最壞的時(shí)代。這是史詩,幸而你我活在其中,幸而未完。”對(duì)于AI時(shí)代,史詩的序曲或許剛剛奏起。
以下是2023騰訊ConTech大會(huì)相關(guān)訪談實(shí)錄:
孫天澍:我們討論的第一個(gè)議題是大模型的產(chǎn)業(yè)機(jī)會(huì),AI正在以什么樣的方式重塑產(chǎn)業(yè),里面的機(jī)會(huì)在哪?接下來大模型在消費(fèi)互聯(lián)網(wǎng)C端的產(chǎn)品形態(tài)和商業(yè)機(jī)會(huì)有哪些?到底是互聯(lián)網(wǎng)大廠的機(jī)會(huì),還是新一代創(chuàng)業(yè)公司的機(jī)會(huì)?
王小川:大模型來了以后,無論是大廠還是創(chuàng)業(yè)公司、投資人都已經(jīng)很瘋狂開始發(fā)展這樣的技術(shù)。我的看法是,大廠至少在現(xiàn)有的產(chǎn)品迭代升級(jí)里面有挺多空間,人員密集型的地方可以用大模型來做替代,也能夠升級(jí)自己的產(chǎn)品。但是對(duì)創(chuàng)業(yè)公司而言,死亡率會(huì)更高。
行業(yè)之前做大模型,有一個(gè)概念叫做大創(chuàng)新靠小廠、小創(chuàng)新靠大廠。大廠的體量也會(huì)有大模型,只要增加1%就是巨大的受益。但是最大的創(chuàng)新可能來自于創(chuàng)業(yè)公司。新的一波機(jī)會(huì),我們的看法是從信息時(shí)代走向智能時(shí)代,會(huì)有新的公司起來。
至于C端怎么用?大模型不是一個(gè)工具,它掌握了語言、世界知識(shí)等,起到了陪伴人類的伙伴角色。它也能成為各種各樣的助手,比如寫作助手、問答助手、私人老師、私人醫(yī)生、私人律師等。
娛樂行業(yè)對(duì)于大模型同樣有著巨大的需求。人類除了工作創(chuàng)造,也需要休閑,大模型在情感陪伴領(lǐng)域不僅可以擬人,甚至可以擬出一個(gè)虛擬世界。這將會(huì)給娛樂行業(yè)、游戲行業(yè)帶來很大的變化。因此,大模型在C端里的兩個(gè)重大方向分別是娛樂行業(yè)和助手。
孫天澍:小廠做大創(chuàng)新,大廠做小創(chuàng)新,但是大廠有自己的陣地,可以在已有的電商娛樂等方向、APP上進(jìn)行升級(jí)。小廠可能會(huì)探索出一些全新的產(chǎn)品,全新的結(jié)構(gòu),這里面有非常多有意思的新一代的產(chǎn)業(yè)機(jī)會(huì)。想問一下邱老師,大模型在開放態(tài)度中的產(chǎn)業(yè)機(jī)會(huì)。整個(gè)大模型在開放生態(tài)發(fā)展非常迅速。第一,未來開源模型在海外,在中國(guó)會(huì)不會(huì)收斂到一到兩個(gè)模型?第二,為開放生態(tài)進(jìn)一步發(fā)展,大模型公司還需要做哪些準(zhǔn)備?國(guó)內(nèi)大模型公司需要在能力上做什么準(zhǔn)備,能夠達(dá)到像OpenAI和Agent智能體未來開放生態(tài)布局?
邱錫鵬:大模型生態(tài)變得非常開放,這里有非常多的參與者,涉及到平民化的問題。平民化可能分成兩個(gè):一方面,因?yàn)榇蠹叶荚趪@著某個(gè)開源,圍繞著比較大的生態(tài)圈,如果提供非常好的個(gè)性化、定制化能力的話,就是技術(shù)戰(zhàn),因?yàn)閰⑴c者眾多,確實(shí)會(huì)降低很多研發(fā)成本。
現(xiàn)在,非常蓬勃的互聯(lián)網(wǎng)生態(tài)發(fā)展包括GPT個(gè)性化、各種工具的使用、任務(wù)規(guī)劃等,這些都需要比較大的模型。但由于大模型的算力成本和計(jì)算成本很高,存在一定阻礙。
目前來講,由于成本的原因,國(guó)內(nèi)還不能將大模型廣泛地應(yīng)用到每個(gè)人身上,讓它變成每個(gè)人的助手。未來,如何去一步提升大模型的效率,把大模型進(jìn)一步壓縮,來降低它真正的計(jì)算成本,讓每個(gè)人都能用得起,這才能達(dá)到真正的平民化。
孫天澍:請(qǐng)小川來分享一下,從大模型在企業(yè)服務(wù)未來的判斷,對(duì)于企業(yè)家來說,想使用大模型能力,是應(yīng)該思考用公有云上調(diào)、智能體結(jié)構(gòu),還是用自己的開源模型融合到企業(yè)知識(shí)庫等,做更加私有化的部署?
王小川:開閉源場(chǎng)景里特別突出的矛盾問題是心態(tài)問題,大模型來了之后,全球人民都怕失業(yè)、企業(yè)怕自己掉隊(duì)。這種情況下,有技術(shù)力量的公司,通常愿意訓(xùn)練一個(gè)模型出來,但這件事情并不夠客觀理性。現(xiàn)在正處于泡沫期,很多公司會(huì)愿意投資訓(xùn)練自己的模型。所以使得百模大戰(zhàn)、千模大戰(zhàn),其實(shí)都是大家的焦感帶來的。
事實(shí)上,到成熟期的時(shí)候,少量企業(yè)能夠有自己的數(shù)據(jù)、場(chǎng)景,能訓(xùn)練出自己的模型給行業(yè)賦能,但是更多的企業(yè)通過調(diào)用方法就夠了,擠掉泡沫后,才能沉淀出來大家的共識(shí)或者價(jià)值。
我給出的建議是,很多企業(yè)不妨克制一下欲望:不是先訓(xùn)練一個(gè)模型,而是先用起來,通過微軟云、接口調(diào)用國(guó)內(nèi)模型,將模型和業(yè)務(wù)鏈路融合起來。之后從產(chǎn)品、市場(chǎng)等方面驗(yàn)證可行性。
孫天澍:接下來問一下邱老師,您從研究者的視角,覺得整個(gè)大模型產(chǎn)業(yè)發(fā)展中,高校和研究者主要的角色和貢獻(xiàn)在哪些方面?他們與大廠,與創(chuàng)業(yè)公司有什么不同?
邱錫鵬:我個(gè)人會(huì)更關(guān)注基礎(chǔ)研究,現(xiàn)在大模型非常成功,它的推進(jìn)速度比我們想象的更快,我和很多公司接觸,發(fā)現(xiàn)他們底層已經(jīng)都用大模型了,用大模型確實(shí)可以降低研發(fā)成本、標(biāo)注數(shù)據(jù)等,它的廣泛性確實(shí)非常好,可能比我們想象中還要更快。
但是做大模型和應(yīng)用大模型,還是可以分開而談。大模型還存在一些不足,包括如何做更高效果的架構(gòu)、推理加速,訓(xùn)練加速等。如果面向未來智能體的發(fā)展,大模型仍然有很多模塊欠缺,比如記憶能力、推理能力、規(guī)劃能力等,包括現(xiàn)在大模型背后的一些機(jī)理,都不足以支撐未來更進(jìn)一步推動(dòng)智能化的發(fā)展。
作為學(xué)術(shù)界的人,我們更關(guān)注大模型的安全可信、誠實(shí)性等,爭(zhēng)取讓它更好地符合人類的價(jià)值觀。
孫天澍:大模型時(shí)代來臨后,人工智能要求人才的結(jié)構(gòu)都很不一樣,高校里有哪些培養(yǎng)機(jī)制?
邱錫鵬:以我們的經(jīng)驗(yàn)來說,大模型需要全棧式的人才。應(yīng)該是從底層的系統(tǒng)結(jié)構(gòu)到模型如何訓(xùn)練,再到AI算法,甚至包括數(shù)據(jù)如何清洗都要懂。否則的話,中間會(huì)斷,大模型研究上會(huì)比較低效。
孫天澍:中國(guó)大模型未來整個(gè)技術(shù)突破和核心競(jìng)爭(zhēng)力會(huì)在哪些方面?在產(chǎn)品應(yīng)用領(lǐng)域,中國(guó)的公司基于自己上一代的互聯(lián)網(wǎng)經(jīng)驗(yàn),產(chǎn)品經(jīng)驗(yàn),以及基于中國(guó)大的消費(fèi)市場(chǎng),能不能做到全球領(lǐng)先?
王小川:我6月份去了一趟美國(guó),跟OpenAI和其他做大模型的同行做了很多交流,發(fā)現(xiàn)我們要接受一個(gè)現(xiàn)實(shí)。OpenAI已經(jīng)發(fā)展了7年,在這樣的技術(shù)積累和場(chǎng)景布局里面,我們是有巨大的差距。
但是我們的產(chǎn)品體驗(yàn)是遠(yuǎn)遠(yuǎn)優(yōu)于美國(guó)的,這里包括大家對(duì)于運(yùn)營(yíng)導(dǎo)向、貼近市場(chǎng)的方式等。我們要在這方面培養(yǎng)大量的產(chǎn)品經(jīng)理,在這種情況下,我們有巨大的經(jīng)驗(yàn)和優(yōu)勢(shì)。這里有兩個(gè)難點(diǎn)需要解決,第一,要有模型,我們要將模型公司與應(yīng)用公司結(jié)合,甚至用開來源和端到端的模式解決,爭(zhēng)取用較弱的模型做出好的應(yīng)用。
第二,產(chǎn)品經(jīng)理也面臨轉(zhuǎn)型和提升。對(duì)產(chǎn)品經(jīng)理而言,他們懂得什么樣的產(chǎn)品適用于今天的技術(shù),甚至還能引領(lǐng)技術(shù)的發(fā)展。產(chǎn)品經(jīng)理要對(duì)技術(shù)有判斷和評(píng)價(jià),爭(zhēng)取讓算法工程師跟上這個(gè)步伐,解決這兩個(gè)問題,中國(guó)的應(yīng)用就能走在美國(guó)的前面。
孫天澍:想問一下邱老師,從基礎(chǔ)研究的角度來看,第一,AI大模型的基礎(chǔ)研究,怎么往更有效率的方式走?第二,計(jì)算機(jī)的研究、人工智能的研究,大模型對(duì)于整個(gè)自然科學(xué)領(lǐng)域的研究等,大模型可能會(huì)在哪些維度為技術(shù)突破、技術(shù)研究帶來沖擊和變化?
邱錫鵬:我們與OpenAI算力的差距太大,保持緊密的跟隨。一方面能夠鍛煉我們的技術(shù),另一方面保持不掉隊(duì),培養(yǎng)人才,能夠達(dá)到非常好的效果。但是在趕超方面,還是要結(jié)合當(dāng)前我國(guó)具體的實(shí)際情況,比如靠產(chǎn)業(yè)的帶動(dòng),從中產(chǎn)生的需求,再把它轉(zhuǎn)化到技術(shù)研究上。我們技術(shù)研究的問題,要由真實(shí)的需求凝練出來,所以產(chǎn)研合作在下一步變得非常重要。
現(xiàn)在的大模型或者以大語言模型為中心的新一代通用AI技術(shù),是用語言來打底,構(gòu)造一個(gè)非常完整的系列知識(shí)體系。很容易把人的各種經(jīng)驗(yàn)通過語言作為載體附加到模型中,在做科學(xué)研究應(yīng)用上的話,它的模式和形態(tài)可能跟以前不一樣。它會(huì)更加側(cè)重科研發(fā)現(xiàn),類似于科研探索,或者主動(dòng)讓他得到一些新的結(jié)論。
孫天澍:關(guān)于技術(shù)突破還有兩個(gè)很重要的話題,大模型四個(gè)要素場(chǎng)景、數(shù)據(jù)、模型、算力,想問大家對(duì)于中文語料進(jìn)一步采集、整理和使用有沒有什么建議?這個(gè)可以從你們自身企業(yè)發(fā)展的角度,或者模型發(fā)展角度,也可以從公共政策、產(chǎn)業(yè)政策的角度,談一談中文語料怎么樣能進(jìn)一步去采集優(yōu)化?
王小川:主要分兩部分,第一是訓(xùn)練大模型所需要的公有數(shù)據(jù)。第二是企業(yè)為了自己的競(jìng)爭(zhēng)力需要的私有數(shù)據(jù)。我的邏輯就是不要迷戀于純中文語料,需要高質(zhì)量的語料都兼顧。至于企業(yè)自身數(shù)據(jù),更多解決的問題是技術(shù)開放性怎么耦合到大模型里的問題。大模型核心靠的是預(yù)訓(xùn)練和最后的微調(diào),企業(yè)語料怎么進(jìn)去,需要技術(shù)實(shí)踐,很多技術(shù)問題還在攻克當(dāng)中,如何更好地把大模型跟自然語言、知識(shí)庫之間對(duì)應(yīng)上,需要工業(yè)界和學(xué)術(shù)界共同解決。
邱錫鵬:對(duì)學(xué)術(shù)界來講,數(shù)據(jù)一直不擅長(zhǎng),我們這方面投入的人力不是很多,基本上以公開數(shù)據(jù)為主。但是這些公開數(shù)據(jù)經(jīng)過一些粗加工,主要以英文居多,中文開放的還不夠。我們需要提出數(shù)據(jù)的衡量標(biāo)準(zhǔn),來評(píng)判什么樣的數(shù)據(jù)是有價(jià)值的,包括知識(shí)量、知識(shí)推理等。
王小川:學(xué)術(shù)界還有特別被動(dòng)的地方,因?yàn)閷W(xué)術(shù)界要通過發(fā)論文來證明自己的創(chuàng)新性,論文很多發(fā)在英文刊物里,如果學(xué)術(shù)界要努力做好中文數(shù)據(jù),不代表可以在這個(gè)評(píng)價(jià)體系里獲勝。所以我們的數(shù)據(jù)和評(píng)價(jià)體系,跟西方走了很多,這是特別被動(dòng)的地方。
孫天澍:再提出一個(gè)方向的問題,在國(guó)內(nèi)算力依然非常稀缺的情況下,如何在有限的算力下更好地用好這些算力資源或配置資源,對(duì)大模型的基礎(chǔ)底座研究做出一些突破?大家能否從產(chǎn)業(yè)視角和學(xué)術(shù)視角做一個(gè)分享?
王小川:我認(rèn)為企業(yè)有動(dòng)力把算力做好,每個(gè)行業(yè)一旦被扶持,能有百家、千家公司做模型,這是一種很大的消耗,所以還是希望大模型對(duì)頭部創(chuàng)新有更多幫助。
邱錫鵬:訓(xùn)練這塊要適當(dāng)集中,訓(xùn)練一個(gè)比較好的推理端,比如模型訓(xùn)練好之后,我們可以提升很多工作的效率,包括做一些優(yōu)化、平民化的工作,這些都需要技術(shù)支撐。
孫天澍:最近一到兩個(gè)月,你們有沒有看到特別激動(dòng)人心的大模型,賦能下一代的產(chǎn)品生態(tài)?或者是產(chǎn)品應(yīng)用?
王小川:今年是元年,剛剛開始,在情感陪伴里面大家看到一些成績(jī)。我們公司既做模型,也做應(yīng)用,內(nèi)部的醫(yī)療模型確實(shí)能夠更好地做問診,醫(yī)療能力還是蠻驚喜的。
邱錫鵬:我這方面了解的少一點(diǎn),我覺得ChatGPT本身,還是比較驚艷的。因?yàn)樗麄儌€(gè)性化的速度非常快。
孫天澍:我覺得智能體是特別值得關(guān)注的一個(gè)方向,大家怎么看?
王小川:因?yàn)镃hatGPT—4到了一定高度之后,智能體就變得非常可行了。國(guó)內(nèi)還是有距離的,國(guó)內(nèi)現(xiàn)在更大的基礎(chǔ)工作一方面是追趕ChatGPT4的水平,這樣才能做智能體。另一方面,追趕過程中,我們開始要做落地的應(yīng)用。這樣的視角會(huì)有些不一樣。
孫天澍:大模型時(shí)代來臨后,兩位老師對(duì)年輕人有哪些建議?
王小川:時(shí)代變革的時(shí)候,年輕人更有機(jī)會(huì)。大家只需要用好大模型,就可以一個(gè)人變成一個(gè)團(tuán)隊(duì),一個(gè)人做一個(gè)公司,這個(gè)機(jī)會(huì)是屬于年輕人的。
邱錫鵬:生成式AI給我們提供了非常好的工具,能夠使得我們做更多的事。只要你能積極擁抱AI技術(shù)以及它帶來的變化,就非常好了。
孫天澍:最后一個(gè)問題,請(qǐng)二位回答一下,大家覺得大模型對(duì)我們社會(huì)生活的改變,像當(dāng)年移動(dòng)互聯(lián)網(wǎng)智能手機(jī)對(duì)我們生活的改變,這個(gè)時(shí)間會(huì)來的多快?
王小川:用孫正義的話講,會(huì)用AI和不會(huì)用AI的人就是像人和猴子區(qū)別一樣,我自己是把ChatGPT放在我手機(jī)的最底下,每天都會(huì)使用。在未來兩三年內(nèi),我們工作方式、生活方式會(huì)有天翻地覆的變化,AI速度已經(jīng)到來了,智能體到來之后,跟你工作的可能不只是人,也有機(jī)器。
邱錫鵬:我也比較樂觀,我覺得三到五年吧。以前電影的類似于AI的形象會(huì)來到我們真正的現(xiàn)實(shí)生活中。
孫天澍:非常感謝二位,在新科技討論中,我們討論了AI大模型的產(chǎn)業(yè)機(jī)會(huì)、技術(shù)突破和未來展望。新一代的AI洶涌澎湃,也希望未來大家能夠持續(xù)關(guān)注,能夠向小川和邱老師一樣,將 AI融入自己的生活中,持續(xù)學(xué)習(xí),把科技的未來和自己的未來聯(lián)系到一起,謝謝大家。