正在閱讀:

OpenAI向左,Meta往右

掃一掃下載界面新聞APP

OpenAI向左,Meta往右

Meta才是整個(gè)AI圈的希望?

圖片來源:Unsplash-Pablo García Salda?a

文|定焦 黎明

編輯|魏佳

OpenAI正變得越來越封閉,但它的對手Meta(前Facebook),卻通過開源贏得不少贊譽(yù)。

1月18日,馬克·扎克伯格宣布,Meta正在計(jì)劃構(gòu)建自己的AGI(通用人工智能),將在絕大多數(shù)領(lǐng)域中都達(dá)到或超越人類智能水平。同時(shí)他強(qiáng)調(diào),保證會(huì)向大眾開放這一技術(shù),以便人人都能從中獲益。

與OpenAI拒絕Open他們的算法、路線、論文相反,Meta選擇Open到底。此前震驚業(yè)內(nèi)的大模型LLaMA,大獲好評的LLaMA 2,以及正在研發(fā)的LLaMA 3,都是開源的。它們成為很多AI公司研究、學(xué)習(xí)甚至抄襲的對象。

通過開源這一手段,Meta在某種程度上打破了大模型的壟斷,成為OpenAI和谷歌雙雄相爭之外的第三股力量。一些人將扎克伯格視為大模型時(shí)代的英雄,有人在扎克伯格的帖子下留言,建議Meta更名為OpenAI,OpenAI更名為CloseAI。

事實(shí)上,Meta過去開源了它研發(fā)的幾乎所有基礎(chǔ)設(shè)施,比如用于Web和APP開發(fā)框架的React,以及機(jī)器學(xué)習(xí)框架PyTorch,而ChatGPT就是基于PyTorch開發(fā)的,OpenAI也運(yùn)行在PyTorch上。按照Meta首席科學(xué)家楊立昆的話說,除谷歌外,全世界都運(yùn)行在PyTorch上,因?yàn)楣雀栌凶约旱南到y(tǒng)。

只是,這些東西在過去都被Meta的負(fù)面新聞掩蓋了——干預(yù)選舉進(jìn)程、提供虛假信息、危害青少年健康,在硅谷,罵Facebook曾是一種“政治正確”, 人們認(rèn)為這是一家價(jià)值觀敗壞的公司。

如今風(fēng)評大變,Meta一時(shí)仿佛成了整個(gè)AI圈的希望,它的股價(jià)在2023年上漲了160%,在美國前五大科技巨頭中漲幅僅次于英偉達(dá),最近重返萬億美元市值,股價(jià)創(chuàng)新高。而曾以挑戰(zhàn)者姿態(tài)崛起的OpenAI,前不久剛經(jīng)歷了一場宮斗,散發(fā)出越來越濃的銅臭味。

OpenAI向左,Meta往右,兩家原本沒有太多交集的公司,正走出截然不同的路。

OpenAI,走向封閉

在討論這兩家公司的境況之前,我們先把時(shí)間拉回到十年前。

2013年,有一家叫DeepMind的AI公司,同時(shí)引起了谷歌和Facebook(當(dāng)時(shí)還沒更名為Meta)的注意。

當(dāng)時(shí)這家公司剛嶄露頭角,嗅覺敏銳的谷歌和Facebook都想收購它。最終,谷歌在競購中勝出,2014年1月將DeepMind收入囊中。三年后,DeepMind開發(fā)的AI機(jī)器人AlphaGo,以4:1擊敗了韓國圍棋冠軍李世石,一舉成名。

谷歌收購DeepMind時(shí),有兩個(gè)人心里很不是滋味。一個(gè)是扎克伯格,他當(dāng)時(shí)已經(jīng)意識到AI的巨大前景;另一個(gè)是馬斯克,他不想AI被谷歌這樣的大公司控制。

于是,扎克伯格決定自己做,他花重金從紐約大學(xué)請來了計(jì)算機(jī)科學(xué)領(lǐng)域的權(quán)威人物楊立昆,啟動(dòng)FAIR項(xiàng)目,在Facebook成立了AI實(shí)驗(yàn)室。馬斯克則和奧爾特曼成立了OpenAI,用來對抗谷歌。

從當(dāng)時(shí)的情形來看,扎克伯格是為了自己的公司,馬斯克是為了全人類。馬斯克認(rèn)為,由大公司控制的少量AI系統(tǒng)很不安全,唯一的辦法是讓盡可能多的人都擁有AI。所以O(shè)penAI一開始就定位開源,是一個(gè)非營利性的機(jī)構(gòu)。

馬斯克當(dāng)時(shí)說:“我們希望有一種類似于Linux版本的AI,不受任何個(gè)人或公司的控制?!?/p>

一個(gè)為私,一個(gè)為公,兩家公司一開始就選了不同的路。

馬斯克提到的Linux,是一款免費(fèi)開源的操作系統(tǒng)。在互聯(lián)網(wǎng)早期,計(jì)算機(jī)剛開始普及時(shí),可用的操作系統(tǒng)不多,要么源代碼被軟件廠商嚴(yán)格保密,要么收取很高昂的費(fèi)用。一個(gè)歐洲大學(xué)生開發(fā)出Linux操作系統(tǒng)的雛形,然后免費(fèi)對外公開了自己的代碼。

由于開源,全球程序員都加入進(jìn)來改進(jìn)代碼,最終創(chuàng)造了Linux操作系統(tǒng),且使用完全免費(fèi)。這大大加速了計(jì)算機(jī)的普及。我們今天熟知的安卓系統(tǒng),就是基于Linux內(nèi)核,全球大部分手機(jī)都跑在這個(gè)系統(tǒng)上。

馬斯克的想法很簡單,AI時(shí)代也需要有這樣一個(gè)開源開放的操作系統(tǒng),市場不能讓巨頭獨(dú)占。

OpenAI的啟動(dòng)資金來源于一批科技大佬捐贈(zèng),它一開始的確是按開源的路徑走的,2019年發(fā)布的GPT-2,就是一個(gè)開源大模型,當(dāng)年還有人用GPT-2為《權(quán)利的游戲》改寫劇本結(jié)尾。

但也是在GPT-2發(fā)布之后,OpenAI逐漸走向封閉。它隨后成立營利性子公司,接受了微軟的數(shù)十億美元投資。

在那之后,2020年發(fā)布的GPT-3,2022年升級的GPT-3.5,以及2023年3月發(fā)布的GPT-4,都是閉源模型,一開始OpenAI還公布論文,到后來連模型具體參數(shù)都不再公布。

而從整個(gè)大模型行業(yè)的競爭格局來看,“OpenAI-微軟”“DeepMind-谷歌”的雙巨頭組合格局正式形成。

馬斯克對此非常不滿。他說,OpenAI設(shè)立時(shí)是一家開源公司,現(xiàn)在變成了一個(gè)閉源、受微軟控制的逐利公司。這根本不是他想要的。

這期間Meta沒閑著。除了折騰元宇宙,Meta的AI團(tuán)隊(duì)一直在研究大語言模型,并發(fā)布了一些開源項(xiàng)目。大家各做各的,互不干涉。

在OpenAI發(fā)布ChatGPT的幾周前,Meta發(fā)布了一個(gè)類似的聊天機(jī)器人Galactica,專門用于撰寫科學(xué)論文。誰知道這個(gè)產(chǎn)品不僅沒引起轟動(dòng),還招來一片罵聲,網(wǎng)友痛斥它會(huì)破壞科學(xué)出版。以至于Meta的人取消了演示,覺都睡不著。

當(dāng)時(shí)人們關(guān)心的是Meta的元宇宙項(xiàng)目是不是快涼了,裁員裁到哪了,沒人關(guān)心它的AI做得咋樣。至于OpenAI,大家覺得它代表新勢力,對它更加包容。

按照楊立昆的說法,兩周后ChatGPT問世,被視為救世主降臨。隨后的很長時(shí)間里,OpenAI都是全球科技界的當(dāng)紅炸子雞,登上神壇奪走了所有目光。人們津津樂道于,OpenAI是如何沖破谷歌的封鎖,對巨頭形成壓制。

在崇尚個(gè)人英雄主義的美國,創(chuàng)業(yè)新秀挑戰(zhàn)舊勢力的劇本,向來充滿話題性。于是大模型頭部選手的競爭,變成了OpenAI和谷歌的雙雄爭霸。

但一向好強(qiáng)的扎克伯格不會(huì)袖手旁觀。Meta秘密研發(fā)的LLaMA大模型,已經(jīng)箭在弦上。

Meta才是全村的希望?

2023年2月,ChatGPT發(fā)布之后3個(gè)月,LLaMA的第一個(gè)版本開源,一開始這個(gè)模型只能用作研究。7月,升級之后的LLaMA 2支持免費(fèi)商用。Meta把模型訓(xùn)練數(shù)據(jù)、訓(xùn)練方法、數(shù)據(jù)標(biāo)注等大量細(xì)節(jié)都公布了,起始代碼全部開源。

LLaMA 2性能非常突出,超過了所有的開源大模型。有人發(fā)現(xiàn),其最大參數(shù)的版本比GPT-3參數(shù)量小,但效果更好。

曾經(jīng)跟著馬斯克從OpenAI跳到特斯拉,后來又被OpenAI挖回去的科學(xué)家Andrej Karpathy,將LLaMA 2的發(fā)布視為人工智能和大模型發(fā)展過程中的重要一天,因?yàn)檫@“是任何人都可以拿到模型權(quán)重的最強(qiáng)大語言模型。”

一時(shí)間,整個(gè)AI圈對Meta刮目相看。當(dāng)一批巨頭公司掀起大模型軍備競賽,試圖通過技術(shù)封閉實(shí)現(xiàn)市場壟斷時(shí),Meta用LLaMA撕開了一條口子。OpenAI沒做的事,Meta做到了。

英諾天使基金合伙人王晟戲稱楊立昆為“Klaus LeCun”( 楊立昆英文名為Yann LeCun,Klaus Fuchs在二戰(zhàn)期間向蘇聯(lián)提供了曼哈頓計(jì)劃的信息)。王晟開玩笑:“不能只讓美國擁有原子彈?!?/p>

王晟發(fā)現(xiàn),ChatGPT出現(xiàn)之后,科技圈對大模型熱情且迷茫。投資人中很多是看熱鬧,“因?yàn)榈谝豢床欢?,第二不敢投,第三投不到。一個(gè)新的技術(shù)范式出現(xiàn),沒人知道它的能力邊界在哪里?!?/p>

王晟對「定焦」說,LLaMA開源對行業(yè)影響很大?!癕eta過去這些年積累的大模型技術(shù),本來都是不傳之秘,結(jié)果一開源,迅速把很多認(rèn)知拉平了?!?/p>

之前,國內(nèi)團(tuán)隊(duì)研發(fā)大模型,只能從零到一不斷試錯(cuò),一旦有個(gè)點(diǎn)被卡住了,即便從技術(shù)角度來說并不是太難,但靠自己可能也需要花一兩年時(shí)間才能解決,需要親自踩很多坑?,F(xiàn)在Meta直接把它的經(jīng)驗(yàn)和數(shù)據(jù)拿出來,在思路和方法上給了行業(yè)非常重要的指引。

“在這個(gè)過程中大家學(xué)習(xí)了很多。假如沒有LLAMA開源,國內(nèi)大模型今天的水平可能會(huì)差很多,我們會(huì)大幅度被人甩下?!蓖蹶烧f。

這也是為什么國內(nèi)一下子突然涌現(xiàn)出200多個(gè)大模型。王小川的百川智能在公司成立僅兩個(gè)月就發(fā)布了一款大模型,其實(shí)就是借鑒了LLaMA。李開復(fù)的零一萬物推出的大模型,也是使用LLaMA的開源模型架構(gòu)。

LLaMA開源對OpenAI最直觀的影響,是有一堆中國公司跳出來“吊打”GPT。在他們的口徑中,已經(jīng)在多項(xiàng)指標(biāo)上超過了GPT模型,雖然很多榜單都是刷出來的。

更深層次的影響在于,大模型開源社區(qū)的力量快速壯大,全球的程序員都能為開源做貢獻(xiàn)。他們開發(fā)出各種開源數(shù)據(jù)集,迭代出更多新模型,縮小與閉源大模型的差距。所以谷歌的工程師說,谷歌沒有護(hù)城河,OpenAI也沒有。

Meta在科技圈的形象變得高大起來?;仡橫eta的發(fā)展,其實(shí)它一直都有開源的傳統(tǒng)。

早在2016年,Meta團(tuán)隊(duì)就開發(fā)并開源了深度學(xué)習(xí)框架PyTorch,它和谷歌的TensorFlow成為深度學(xué)習(xí)領(lǐng)域的兩大主流框架。

跟OpenAI現(xiàn)在才開始秘密推進(jìn)芯片制造項(xiàng)目不同,Meta在三年前就設(shè)計(jì)了自研AI推理芯片,并采用了開源架構(gòu)。

在語言翻譯方面它推出了很多開源模型,兩年前發(fā)布的NLLB模型是維基百科的翻譯供應(yīng)商之一,2023年發(fā)布的SeamlessM4T可以翻譯近百種語言,同時(shí)它還發(fā)布了全球最大的開放多模態(tài)翻譯數(shù)據(jù)集。

有研究人員經(jīng)過對比認(rèn)為,Meta更傾向于信任、問責(zé)制以及通過開源實(shí)現(xiàn)人工智能的民主化。

反觀OpenAI,它依然在技術(shù)上保持領(lǐng)先,但拒絕開放。

“沒人知道OpenAI進(jìn)展到什么程度了,包括它正在研發(fā)的GPT-5,是不是繼續(xù)用的transformer都是未知數(shù)?,F(xiàn)在大家都跟著GPT-3.5的技術(shù)路線在跑,假設(shè)它悄悄變換了方向,那大家就掉坑里了。因?yàn)闆]人知道正確路線是什么?!币晃籄I公司的創(chuàng)始人說。

同時(shí)它試圖阻擋競爭對手,以保持自己的先發(fā)優(yōu)勢。

字節(jié)跳動(dòng)在2023年12月被OpenAI停用賬戶,因?yàn)樗谡{(diào)用OpenAI的API開發(fā)自身大語言模型的時(shí)候,違反了OpenAI的服務(wù)條款。有悖商業(yè)倫理的行為肯定是不對的,但外界由此關(guān)注到OpenAI的商業(yè)條款,它禁止客戶使用GPT輸出的內(nèi)容開發(fā)任何可能會(huì)給OpenAI帶來競爭的AI模型。

值得注意的是,微軟也有類似條款。它們將商業(yè)上的競爭優(yōu)勢看得很重要。

人工智能公司開放傳神(OpenCSG)創(chuàng)始人、CEO陳冉認(rèn)為,開源的市場空間遠(yuǎn)比閉源大,但未來一定是開源和閉源兩條路同時(shí)走,“OpenAI開源不開源其實(shí)不重要了?!?/p>

開源閉源,誰對誰錯(cuò)?

究竟是OpenAI被利益蒙蔽了雙眼,還是Meta大公無私要為全人類做貢獻(xiàn)?

或許,它們在本質(zhì)上并無不同。OpenAI既沒有那么自私,Meta也不像網(wǎng)友鼓吹的那樣高尚,區(qū)別只在于路線和策略。

若論對整個(gè)AI行業(yè)的貢獻(xiàn),OpenAI毫無疑問是最大的。畢竟,這一輪AI浪潮是由ChatGPT掀起的。它點(diǎn)燃了一把火,加速了大模型的普及。事實(shí)上,前兩年大模型開源社區(qū)基本是圍著GPT-3在轉(zhuǎn)。

OpenAI不像谷歌、Meta那些巨頭擁有雄厚的資金積累,早年大佬捐贈(zèng)的資金早花得差不多了,沒錢是做不了研發(fā)的,總不能用愛發(fā)電。所以O(shè)penAI抱了微軟的大腿,奧爾特曼想盡辦法為OpenAI賺錢。

陳冉認(rèn)為,OpenAI的成功其實(shí)是商業(yè)模式的成功,本質(zhì)是投資人看到了巨大的商業(yè)價(jià)值和盈利模式。開源與閉源之間的競爭方向一定是掙錢模式的創(chuàng)新競爭。

Meta將技術(shù)開源,也不是只為他人做嫁衣。開源是一種策略,能吸引更多開發(fā)人員免費(fèi)幫它迭代技術(shù)、修復(fù)漏洞,正所謂眾人拾柴火焰高,但最核心的技術(shù)還是掌握在Meta手里,該打擊對手的時(shí)候它不會(huì)手軟。就像谷歌,它旗下的安卓是開源系統(tǒng),但國內(nèi)手機(jī)廠商做自己的系統(tǒng)還是會(huì)有很多限制。

而在大模型火起來之前,Meta掉進(jìn)了元宇宙的深坑里無法自拔,砸錢、虧損、裁員,看不到任何希望。大模型是那根救命稻草,ChatGPT則是照亮前路的那束光。

再往深了看,閉源的OpenAI和開源的Meta,從根本上對AI的價(jià)值判斷有分歧。

如果將AI比作未來世界的核武器,OpenAI認(rèn)為它很危險(xiǎn),得謹(jǐn)慎,不能濫用。Meta則認(rèn)為,核武器不能只掌握在少數(shù)幾個(gè)玩家手里,應(yīng)該開放研究。

關(guān)于AI的利弊之辯,是科技圈的一個(gè)老話題。馬斯克就相信“AI危險(xiǎn)論”,他擔(dān)心有一天機(jī)器的智力、意識都超過了人類,可能會(huì)取代人類,摧毀人類文明。所以他當(dāng)年?duì)款^成立OpenAI,只是后來OpenAI沒按他設(shè)想的路徑走。

基于“防止AI取代人類”的愿景,行業(yè)里又延伸出兩大派別。一派認(rèn)為大量獨(dú)立的AI系統(tǒng)比由大公司控制的少量AI系統(tǒng)更安全,AI的研究應(yīng)該開源開放;另一派認(rèn)為應(yīng)該封閉研究,這可以減輕安全風(fēng)險(xiǎn),防止不法分子濫用獲得的代碼。

OpenAI屬于后者。支持它的人認(rèn)為開源策略加大了風(fēng)險(xiǎn),比如倫敦一家AI公司的CEO就認(rèn)為,Meta是最不負(fù)責(zé)任的人工智能參與者,他問:“我們應(yīng)該令核武器的設(shè)計(jì)透明化嗎?”

Meta將開源視為最優(yōu)策略,楊立昆就認(rèn)為,機(jī)器最終會(huì)比人類更聰明,人類無法阻止壞人獲取它,AI必須是開源的,只有讓更多人參與其中,最終開發(fā)出的系統(tǒng)才會(huì)更安全。他認(rèn)為馬斯克的AI威脅論就是科幻小說看多了。

楊立昆曾經(jīng)的合作伙伴,跟他一塊獲得圖靈獎(jiǎng)的杰弗里·辛頓,則持有不同觀點(diǎn),認(rèn)為AI將對人類構(gòu)成嚴(yán)重威脅。他的思想也許對他的學(xué)生伊利亞造成了影響。伊利亞是OpenAI的聯(lián)合創(chuàng)始人兼首席科學(xué)家,幾乎決定了OpenAI的技術(shù)路線,他也是OpenAI宮斗事件中開除奧爾特曼的關(guān)鍵人物。伊利亞一直致力于追求安全可靠的AGI。業(yè)內(nèi)普遍認(rèn)為,商業(yè)化和AGI的路線之爭,引發(fā)了那場沖突。

所以,OpenAI和Meta有不同的信念。OpenAI將AGI視為終極目標(biāo),并且相信自己將會(huì)第一個(gè)實(shí)現(xiàn)它;Meta將開放平臺(tái)視為最好的路徑,試圖制定開源標(biāo)準(zhǔn)。當(dāng)然,它們都希望在這個(gè)過程里拿到應(yīng)得的商業(yè)利益。

往長遠(yuǎn)看,AI的發(fā)展是螺旋式上升的,開源也好,閉源也罷,都將為其注入動(dòng)能。究竟誰是真的在為全人類的未來操心,只有等待時(shí)間檢驗(yàn)了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

Facebook

4.9k
  • Meta據(jù)悉敦促加州司法部長阻止OpenAI轉(zhuǎn)變?yōu)闋I利性公司
  • Meta與亞馬遜相繼確認(rèn)向特朗普就職基金捐款100萬美元

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

OpenAI向左,Meta往右

Meta才是整個(gè)AI圈的希望?

圖片來源:Unsplash-Pablo García Salda?a

文|定焦 黎明

編輯|魏佳

OpenAI正變得越來越封閉,但它的對手Meta(前Facebook),卻通過開源贏得不少贊譽(yù)。

1月18日,馬克·扎克伯格宣布,Meta正在計(jì)劃構(gòu)建自己的AGI(通用人工智能),將在絕大多數(shù)領(lǐng)域中都達(dá)到或超越人類智能水平。同時(shí)他強(qiáng)調(diào),保證會(huì)向大眾開放這一技術(shù),以便人人都能從中獲益。

與OpenAI拒絕Open他們的算法、路線、論文相反,Meta選擇Open到底。此前震驚業(yè)內(nèi)的大模型LLaMA,大獲好評的LLaMA 2,以及正在研發(fā)的LLaMA 3,都是開源的。它們成為很多AI公司研究、學(xué)習(xí)甚至抄襲的對象。

通過開源這一手段,Meta在某種程度上打破了大模型的壟斷,成為OpenAI和谷歌雙雄相爭之外的第三股力量。一些人將扎克伯格視為大模型時(shí)代的英雄,有人在扎克伯格的帖子下留言,建議Meta更名為OpenAI,OpenAI更名為CloseAI。

事實(shí)上,Meta過去開源了它研發(fā)的幾乎所有基礎(chǔ)設(shè)施,比如用于Web和APP開發(fā)框架的React,以及機(jī)器學(xué)習(xí)框架PyTorch,而ChatGPT就是基于PyTorch開發(fā)的,OpenAI也運(yùn)行在PyTorch上。按照Meta首席科學(xué)家楊立昆的話說,除谷歌外,全世界都運(yùn)行在PyTorch上,因?yàn)楣雀栌凶约旱南到y(tǒng)。

只是,這些東西在過去都被Meta的負(fù)面新聞掩蓋了——干預(yù)選舉進(jìn)程、提供虛假信息、危害青少年健康,在硅谷,罵Facebook曾是一種“政治正確”, 人們認(rèn)為這是一家價(jià)值觀敗壞的公司。

如今風(fēng)評大變,Meta一時(shí)仿佛成了整個(gè)AI圈的希望,它的股價(jià)在2023年上漲了160%,在美國前五大科技巨頭中漲幅僅次于英偉達(dá),最近重返萬億美元市值,股價(jià)創(chuàng)新高。而曾以挑戰(zhàn)者姿態(tài)崛起的OpenAI,前不久剛經(jīng)歷了一場宮斗,散發(fā)出越來越濃的銅臭味。

OpenAI向左,Meta往右,兩家原本沒有太多交集的公司,正走出截然不同的路。

OpenAI,走向封閉

在討論這兩家公司的境況之前,我們先把時(shí)間拉回到十年前。

2013年,有一家叫DeepMind的AI公司,同時(shí)引起了谷歌和Facebook(當(dāng)時(shí)還沒更名為Meta)的注意。

當(dāng)時(shí)這家公司剛嶄露頭角,嗅覺敏銳的谷歌和Facebook都想收購它。最終,谷歌在競購中勝出,2014年1月將DeepMind收入囊中。三年后,DeepMind開發(fā)的AI機(jī)器人AlphaGo,以4:1擊敗了韓國圍棋冠軍李世石,一舉成名。

谷歌收購DeepMind時(shí),有兩個(gè)人心里很不是滋味。一個(gè)是扎克伯格,他當(dāng)時(shí)已經(jīng)意識到AI的巨大前景;另一個(gè)是馬斯克,他不想AI被谷歌這樣的大公司控制。

于是,扎克伯格決定自己做,他花重金從紐約大學(xué)請來了計(jì)算機(jī)科學(xué)領(lǐng)域的權(quán)威人物楊立昆,啟動(dòng)FAIR項(xiàng)目,在Facebook成立了AI實(shí)驗(yàn)室。馬斯克則和奧爾特曼成立了OpenAI,用來對抗谷歌。

從當(dāng)時(shí)的情形來看,扎克伯格是為了自己的公司,馬斯克是為了全人類。馬斯克認(rèn)為,由大公司控制的少量AI系統(tǒng)很不安全,唯一的辦法是讓盡可能多的人都擁有AI。所以O(shè)penAI一開始就定位開源,是一個(gè)非營利性的機(jī)構(gòu)。

馬斯克當(dāng)時(shí)說:“我們希望有一種類似于Linux版本的AI,不受任何個(gè)人或公司的控制。”

一個(gè)為私,一個(gè)為公,兩家公司一開始就選了不同的路。

馬斯克提到的Linux,是一款免費(fèi)開源的操作系統(tǒng)。在互聯(lián)網(wǎng)早期,計(jì)算機(jī)剛開始普及時(shí),可用的操作系統(tǒng)不多,要么源代碼被軟件廠商嚴(yán)格保密,要么收取很高昂的費(fèi)用。一個(gè)歐洲大學(xué)生開發(fā)出Linux操作系統(tǒng)的雛形,然后免費(fèi)對外公開了自己的代碼。

由于開源,全球程序員都加入進(jìn)來改進(jìn)代碼,最終創(chuàng)造了Linux操作系統(tǒng),且使用完全免費(fèi)。這大大加速了計(jì)算機(jī)的普及。我們今天熟知的安卓系統(tǒng),就是基于Linux內(nèi)核,全球大部分手機(jī)都跑在這個(gè)系統(tǒng)上。

馬斯克的想法很簡單,AI時(shí)代也需要有這樣一個(gè)開源開放的操作系統(tǒng),市場不能讓巨頭獨(dú)占。

OpenAI的啟動(dòng)資金來源于一批科技大佬捐贈(zèng),它一開始的確是按開源的路徑走的,2019年發(fā)布的GPT-2,就是一個(gè)開源大模型,當(dāng)年還有人用GPT-2為《權(quán)利的游戲》改寫劇本結(jié)尾。

但也是在GPT-2發(fā)布之后,OpenAI逐漸走向封閉。它隨后成立營利性子公司,接受了微軟的數(shù)十億美元投資。

在那之后,2020年發(fā)布的GPT-3,2022年升級的GPT-3.5,以及2023年3月發(fā)布的GPT-4,都是閉源模型,一開始OpenAI還公布論文,到后來連模型具體參數(shù)都不再公布。

而從整個(gè)大模型行業(yè)的競爭格局來看,“OpenAI-微軟”“DeepMind-谷歌”的雙巨頭組合格局正式形成。

馬斯克對此非常不滿。他說,OpenAI設(shè)立時(shí)是一家開源公司,現(xiàn)在變成了一個(gè)閉源、受微軟控制的逐利公司。這根本不是他想要的。

這期間Meta沒閑著。除了折騰元宇宙,Meta的AI團(tuán)隊(duì)一直在研究大語言模型,并發(fā)布了一些開源項(xiàng)目。大家各做各的,互不干涉。

在OpenAI發(fā)布ChatGPT的幾周前,Meta發(fā)布了一個(gè)類似的聊天機(jī)器人Galactica,專門用于撰寫科學(xué)論文。誰知道這個(gè)產(chǎn)品不僅沒引起轟動(dòng),還招來一片罵聲,網(wǎng)友痛斥它會(huì)破壞科學(xué)出版。以至于Meta的人取消了演示,覺都睡不著。

當(dāng)時(shí)人們關(guān)心的是Meta的元宇宙項(xiàng)目是不是快涼了,裁員裁到哪了,沒人關(guān)心它的AI做得咋樣。至于OpenAI,大家覺得它代表新勢力,對它更加包容。

按照楊立昆的說法,兩周后ChatGPT問世,被視為救世主降臨。隨后的很長時(shí)間里,OpenAI都是全球科技界的當(dāng)紅炸子雞,登上神壇奪走了所有目光。人們津津樂道于,OpenAI是如何沖破谷歌的封鎖,對巨頭形成壓制。

在崇尚個(gè)人英雄主義的美國,創(chuàng)業(yè)新秀挑戰(zhàn)舊勢力的劇本,向來充滿話題性。于是大模型頭部選手的競爭,變成了OpenAI和谷歌的雙雄爭霸。

但一向好強(qiáng)的扎克伯格不會(huì)袖手旁觀。Meta秘密研發(fā)的LLaMA大模型,已經(jīng)箭在弦上。

Meta才是全村的希望?

2023年2月,ChatGPT發(fā)布之后3個(gè)月,LLaMA的第一個(gè)版本開源,一開始這個(gè)模型只能用作研究。7月,升級之后的LLaMA 2支持免費(fèi)商用。Meta把模型訓(xùn)練數(shù)據(jù)、訓(xùn)練方法、數(shù)據(jù)標(biāo)注等大量細(xì)節(jié)都公布了,起始代碼全部開源。

LLaMA 2性能非常突出,超過了所有的開源大模型。有人發(fā)現(xiàn),其最大參數(shù)的版本比GPT-3參數(shù)量小,但效果更好。

曾經(jīng)跟著馬斯克從OpenAI跳到特斯拉,后來又被OpenAI挖回去的科學(xué)家Andrej Karpathy,將LLaMA 2的發(fā)布視為人工智能和大模型發(fā)展過程中的重要一天,因?yàn)檫@“是任何人都可以拿到模型權(quán)重的最強(qiáng)大語言模型。”

一時(shí)間,整個(gè)AI圈對Meta刮目相看。當(dāng)一批巨頭公司掀起大模型軍備競賽,試圖通過技術(shù)封閉實(shí)現(xiàn)市場壟斷時(shí),Meta用LLaMA撕開了一條口子。OpenAI沒做的事,Meta做到了。

英諾天使基金合伙人王晟戲稱楊立昆為“Klaus LeCun”( 楊立昆英文名為Yann LeCun,Klaus Fuchs在二戰(zhàn)期間向蘇聯(lián)提供了曼哈頓計(jì)劃的信息)。王晟開玩笑:“不能只讓美國擁有原子彈。”

王晟發(fā)現(xiàn),ChatGPT出現(xiàn)之后,科技圈對大模型熱情且迷茫。投資人中很多是看熱鬧,“因?yàn)榈谝豢床欢?,第二不敢投,第三投不到。一個(gè)新的技術(shù)范式出現(xiàn),沒人知道它的能力邊界在哪里。”

王晟對「定焦」說,LLaMA開源對行業(yè)影響很大?!癕eta過去這些年積累的大模型技術(shù),本來都是不傳之秘,結(jié)果一開源,迅速把很多認(rèn)知拉平了。”

之前,國內(nèi)團(tuán)隊(duì)研發(fā)大模型,只能從零到一不斷試錯(cuò),一旦有個(gè)點(diǎn)被卡住了,即便從技術(shù)角度來說并不是太難,但靠自己可能也需要花一兩年時(shí)間才能解決,需要親自踩很多坑?,F(xiàn)在Meta直接把它的經(jīng)驗(yàn)和數(shù)據(jù)拿出來,在思路和方法上給了行業(yè)非常重要的指引。

“在這個(gè)過程中大家學(xué)習(xí)了很多。假如沒有LLAMA開源,國內(nèi)大模型今天的水平可能會(huì)差很多,我們會(huì)大幅度被人甩下。”王晟說。

這也是為什么國內(nèi)一下子突然涌現(xiàn)出200多個(gè)大模型。王小川的百川智能在公司成立僅兩個(gè)月就發(fā)布了一款大模型,其實(shí)就是借鑒了LLaMA。李開復(fù)的零一萬物推出的大模型,也是使用LLaMA的開源模型架構(gòu)。

LLaMA開源對OpenAI最直觀的影響,是有一堆中國公司跳出來“吊打”GPT。在他們的口徑中,已經(jīng)在多項(xiàng)指標(biāo)上超過了GPT模型,雖然很多榜單都是刷出來的。

更深層次的影響在于,大模型開源社區(qū)的力量快速壯大,全球的程序員都能為開源做貢獻(xiàn)。他們開發(fā)出各種開源數(shù)據(jù)集,迭代出更多新模型,縮小與閉源大模型的差距。所以谷歌的工程師說,谷歌沒有護(hù)城河,OpenAI也沒有。

Meta在科技圈的形象變得高大起來?;仡橫eta的發(fā)展,其實(shí)它一直都有開源的傳統(tǒng)。

早在2016年,Meta團(tuán)隊(duì)就開發(fā)并開源了深度學(xué)習(xí)框架PyTorch,它和谷歌的TensorFlow成為深度學(xué)習(xí)領(lǐng)域的兩大主流框架。

跟OpenAI現(xiàn)在才開始秘密推進(jìn)芯片制造項(xiàng)目不同,Meta在三年前就設(shè)計(jì)了自研AI推理芯片,并采用了開源架構(gòu)。

在語言翻譯方面它推出了很多開源模型,兩年前發(fā)布的NLLB模型是維基百科的翻譯供應(yīng)商之一,2023年發(fā)布的SeamlessM4T可以翻譯近百種語言,同時(shí)它還發(fā)布了全球最大的開放多模態(tài)翻譯數(shù)據(jù)集。

有研究人員經(jīng)過對比認(rèn)為,Meta更傾向于信任、問責(zé)制以及通過開源實(shí)現(xiàn)人工智能的民主化。

反觀OpenAI,它依然在技術(shù)上保持領(lǐng)先,但拒絕開放。

“沒人知道OpenAI進(jìn)展到什么程度了,包括它正在研發(fā)的GPT-5,是不是繼續(xù)用的transformer都是未知數(shù)?,F(xiàn)在大家都跟著GPT-3.5的技術(shù)路線在跑,假設(shè)它悄悄變換了方向,那大家就掉坑里了。因?yàn)闆]人知道正確路線是什么。”一位AI公司的創(chuàng)始人說。

同時(shí)它試圖阻擋競爭對手,以保持自己的先發(fā)優(yōu)勢。

字節(jié)跳動(dòng)在2023年12月被OpenAI停用賬戶,因?yàn)樗谡{(diào)用OpenAI的API開發(fā)自身大語言模型的時(shí)候,違反了OpenAI的服務(wù)條款。有悖商業(yè)倫理的行為肯定是不對的,但外界由此關(guān)注到OpenAI的商業(yè)條款,它禁止客戶使用GPT輸出的內(nèi)容開發(fā)任何可能會(huì)給OpenAI帶來競爭的AI模型。

值得注意的是,微軟也有類似條款。它們將商業(yè)上的競爭優(yōu)勢看得很重要。

人工智能公司開放傳神(OpenCSG)創(chuàng)始人、CEO陳冉認(rèn)為,開源的市場空間遠(yuǎn)比閉源大,但未來一定是開源和閉源兩條路同時(shí)走,“OpenAI開源不開源其實(shí)不重要了?!?/p>

開源閉源,誰對誰錯(cuò)?

究竟是OpenAI被利益蒙蔽了雙眼,還是Meta大公無私要為全人類做貢獻(xiàn)?

或許,它們在本質(zhì)上并無不同。OpenAI既沒有那么自私,Meta也不像網(wǎng)友鼓吹的那樣高尚,區(qū)別只在于路線和策略。

若論對整個(gè)AI行業(yè)的貢獻(xiàn),OpenAI毫無疑問是最大的。畢竟,這一輪AI浪潮是由ChatGPT掀起的。它點(diǎn)燃了一把火,加速了大模型的普及。事實(shí)上,前兩年大模型開源社區(qū)基本是圍著GPT-3在轉(zhuǎn)。

OpenAI不像谷歌、Meta那些巨頭擁有雄厚的資金積累,早年大佬捐贈(zèng)的資金早花得差不多了,沒錢是做不了研發(fā)的,總不能用愛發(fā)電。所以O(shè)penAI抱了微軟的大腿,奧爾特曼想盡辦法為OpenAI賺錢。

陳冉認(rèn)為,OpenAI的成功其實(shí)是商業(yè)模式的成功,本質(zhì)是投資人看到了巨大的商業(yè)價(jià)值和盈利模式。開源與閉源之間的競爭方向一定是掙錢模式的創(chuàng)新競爭。

Meta將技術(shù)開源,也不是只為他人做嫁衣。開源是一種策略,能吸引更多開發(fā)人員免費(fèi)幫它迭代技術(shù)、修復(fù)漏洞,正所謂眾人拾柴火焰高,但最核心的技術(shù)還是掌握在Meta手里,該打擊對手的時(shí)候它不會(huì)手軟。就像谷歌,它旗下的安卓是開源系統(tǒng),但國內(nèi)手機(jī)廠商做自己的系統(tǒng)還是會(huì)有很多限制。

而在大模型火起來之前,Meta掉進(jìn)了元宇宙的深坑里無法自拔,砸錢、虧損、裁員,看不到任何希望。大模型是那根救命稻草,ChatGPT則是照亮前路的那束光。

再往深了看,閉源的OpenAI和開源的Meta,從根本上對AI的價(jià)值判斷有分歧。

如果將AI比作未來世界的核武器,OpenAI認(rèn)為它很危險(xiǎn),得謹(jǐn)慎,不能濫用。Meta則認(rèn)為,核武器不能只掌握在少數(shù)幾個(gè)玩家手里,應(yīng)該開放研究。

關(guān)于AI的利弊之辯,是科技圈的一個(gè)老話題。馬斯克就相信“AI危險(xiǎn)論”,他擔(dān)心有一天機(jī)器的智力、意識都超過了人類,可能會(huì)取代人類,摧毀人類文明。所以他當(dāng)年?duì)款^成立OpenAI,只是后來OpenAI沒按他設(shè)想的路徑走。

基于“防止AI取代人類”的愿景,行業(yè)里又延伸出兩大派別。一派認(rèn)為大量獨(dú)立的AI系統(tǒng)比由大公司控制的少量AI系統(tǒng)更安全,AI的研究應(yīng)該開源開放;另一派認(rèn)為應(yīng)該封閉研究,這可以減輕安全風(fēng)險(xiǎn),防止不法分子濫用獲得的代碼。

OpenAI屬于后者。支持它的人認(rèn)為開源策略加大了風(fēng)險(xiǎn),比如倫敦一家AI公司的CEO就認(rèn)為,Meta是最不負(fù)責(zé)任的人工智能參與者,他問:“我們應(yīng)該令核武器的設(shè)計(jì)透明化嗎?”

Meta將開源視為最優(yōu)策略,楊立昆就認(rèn)為,機(jī)器最終會(huì)比人類更聰明,人類無法阻止壞人獲取它,AI必須是開源的,只有讓更多人參與其中,最終開發(fā)出的系統(tǒng)才會(huì)更安全。他認(rèn)為馬斯克的AI威脅論就是科幻小說看多了。

楊立昆曾經(jīng)的合作伙伴,跟他一塊獲得圖靈獎(jiǎng)的杰弗里·辛頓,則持有不同觀點(diǎn),認(rèn)為AI將對人類構(gòu)成嚴(yán)重威脅。他的思想也許對他的學(xué)生伊利亞造成了影響。伊利亞是OpenAI的聯(lián)合創(chuàng)始人兼首席科學(xué)家,幾乎決定了OpenAI的技術(shù)路線,他也是OpenAI宮斗事件中開除奧爾特曼的關(guān)鍵人物。伊利亞一直致力于追求安全可靠的AGI。業(yè)內(nèi)普遍認(rèn)為,商業(yè)化和AGI的路線之爭,引發(fā)了那場沖突。

所以,OpenAI和Meta有不同的信念。OpenAI將AGI視為終極目標(biāo),并且相信自己將會(huì)第一個(gè)實(shí)現(xiàn)它;Meta將開放平臺(tái)視為最好的路徑,試圖制定開源標(biāo)準(zhǔn)。當(dāng)然,它們都希望在這個(gè)過程里拿到應(yīng)得的商業(yè)利益。

往長遠(yuǎn)看,AI的發(fā)展是螺旋式上升的,開源也好,閉源也罷,都將為其注入動(dòng)能。究竟誰是真的在為全人類的未來操心,只有等待時(shí)間檢驗(yàn)了。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。