正在閱讀:

為什么說谷歌才是吃到大模型紅利的科技巨頭?

掃一掃下載界面新聞APP

為什么說谷歌才是吃到大模型紅利的科技巨頭?

在AI的戰(zhàn)場上,硝煙從未如此濃烈。

圖片來源:界面新聞 匡達(dá)

文|BT財經(jīng) Rickzhang

近日,谷歌發(fā)布了令人矚目的2023年財報。

雖然谷歌推出的抗衡Gpt4大模型的Gemini,在去年12月份才正式上線。但谷歌實(shí)際上在自己業(yè)務(wù)體系中,早已將大模型的能力深度與業(yè)務(wù)捆綁。

相關(guān)新聞報道顯示,跟李彥宏不遺余力推動文心大模型與百度各項(xiàng)業(yè)務(wù)融合一樣,在去年的上半年,谷歌內(nèi)部已經(jīng)開啟了用谷歌推出大模型原型對谷歌業(yè)務(wù)進(jìn)行深度整理和升級。

尤其在谷歌最引為支柱的廣告與谷歌云服務(wù)上。

結(jié)果就是云服務(wù)經(jīng)歷了從2022年開始的低潮和虧損,到2023年四季度實(shí)現(xiàn)了整體盈利;而谷歌的廣告業(yè)務(wù),也從以往個位數(shù)的增長變成全年增長超過了10%。

據(jù)路透社報道,谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)表示,生成式人工智能正在推動云計算的增長。谷歌云最近一個季度的收入為92億美元,超過了預(yù)期的89億美元。這標(biāo)志著云收入增長從上一季度重新加速至25.7%。

在這樣的背景下,谷歌2023年的財報數(shù)據(jù)更是亮眼。全年歸屬于普通股東的凈利潤達(dá)到737.95億美元,同比增長23.05%,營業(yè)收入也同比增長8.68%,達(dá)到3073.94億美元。尤其是公司四季度,歸屬于普通股東的凈利潤同比增長高達(dá)51.84%,營業(yè)收入也實(shí)現(xiàn)了13.49%的同比增長。這一系列數(shù)字,無疑是谷歌強(qiáng)大盈利能力的最好證明。

與此同時,當(dāng)我們將目光轉(zhuǎn)向其他科技巨頭時,會發(fā)現(xiàn)谷歌的表現(xiàn)更加難能可貴。OpenAI,作為大模型的先驅(qū)者之一,至今仍未找到盈利的出口;而扎克伯格投入巨資打造的大模型,每個季度還要面臨十幾億美元的虧損。相比之下,谷歌的盈利增長不僅穩(wěn)健而且強(qiáng)勁,這無疑說明他們可能已經(jīng)成為了西方科技巨頭中第一個吃到大模型紅利的企業(yè)。

微軟雖然在2023年實(shí)現(xiàn)了云服務(wù)的高速增長,但如果我們將微軟給OpenAI提供的近150億美元資金支持考慮在內(nèi),那么微軟在大模型上的投入實(shí)際上依然沒有看到盈利的曙光。

這讓谷歌現(xiàn)在的表現(xiàn)有些鶴立雞群。

一份出乎意料的財報

在科技江湖中,每一份財報都如同高手過招的秘籍,透露著企業(yè)的內(nèi)力修為與未來走向。當(dāng)?shù)貢r間2024年1月30日,谷歌母公司Alphabet亮出了自己的2023年財報,一時間風(fēng)起云涌,吸引了無數(shù)眼球。

這不僅僅是一份財報,更像是一部跌宕起伏的科技傳奇。Alphabet的業(yè)績?nèi)缤^山車一般,讓人驚嘆不已。

截至2023年12月31日的三個月內(nèi),Alphabet的季度合并收入高達(dá)863.1億美元,同比增長了驚人的13%。公司實(shí)現(xiàn)凈利潤更是飆升至206.9億美元,相比前一年同期的136億美元,增長了整整52%。而全年來看,Alphabet的合并收入更是達(dá)到了驚人的3073.9億美元,同比增長9%,凈利潤也高達(dá)738億美元。

在這份財報中,最引人注目的莫過于谷歌云業(yè)務(wù)的華麗轉(zhuǎn)身。曾幾何時,谷歌云還在虧損的泥潭中掙扎,連續(xù)四個季度虧損總額超過19億美元。然而,在2023年,它如同鳳凰涅槃一般,不僅成功扭虧為盈,還實(shí)現(xiàn)了超過17億美元的盈利。這樣的轉(zhuǎn)變,讓人不禁對谷歌云的未來充滿了期待。

這背后的功臣,非生成式AI莫屬。在2023年的熱潮中,谷歌緊跟時代步伐,連續(xù)四個季度研發(fā)投入同比增長8%到26%不等。全年研發(fā)費(fèi)用高達(dá)454億美元,比上一年多投入了整整59億美元。這樣的投入力度,足以彰顯谷歌在AI領(lǐng)域的決心和野心。

與此同時,谷歌在投資方面也毫不吝嗇。2023年,谷歌用于投資活動的現(xiàn)金凈額超過了270億美元,比上一年增加了67.7億美元。其中,最引人矚目的莫過于對初創(chuàng)公司Anthropic的20億美元追投。這家公司研發(fā)的大模型Claude,被視為ChatGPT的最強(qiáng)競品。谷歌的這一舉動,無疑是在AI領(lǐng)域布下了一枚重要的棋子。

在這份財報中,廣告業(yè)務(wù)的表現(xiàn)也同樣搶眼。盡管面臨著各種挑戰(zhàn)和競爭,但谷歌的廣告業(yè)務(wù)依然如同常青樹一般,保持著穩(wěn)健的增長勢頭。2023年第四季度,廣告業(yè)務(wù)的營收達(dá)到了655億美元,同比增長了12%。這樣的成績,足以證明谷歌在廣告市場的深厚實(shí)力和無法撼動的地位。

當(dāng)然,云計算市場也是谷歌的重要戰(zhàn)場之一。雖然目前谷歌云在全球市場份額上排名第三,落后于亞馬遜和微軟。但本季度的業(yè)績表明,谷歌云已經(jīng)開始發(fā)力,首次實(shí)現(xiàn)了全年盈利。而且,其營收增速接近26%,甚至超過了微軟云業(yè)務(wù)同期的增速20%。在大模型的支持下,谷歌云第四季度贏得了全球云服務(wù)市場11%的份額。這樣的表現(xiàn),足以讓人對谷歌云的未來充滿期待。

這份財報的發(fā)布,無疑給那些對谷歌持懷疑態(tài)度的人一記響亮的耳光。面對微軟的步步緊逼和OpenAI的崛起,谷歌沒有選擇坐以待斃,而是積極應(yīng)對,加大研發(fā)投入和投資布局。如今,這份出乎意料的財報就是最好的證明。

值得一提的是,在這份財報發(fā)布之際,谷歌的聯(lián)合創(chuàng)始人謝爾蓋·布林也開始越來越多地參與到Alphabet的人工智能發(fā)展中來。這位曾經(jīng)“歸隱山林”的傳奇人物如今重出江湖,無疑給谷歌的未來發(fā)展增添了一份神秘色彩和無限可能。

AI的注入帶來希望

其實(shí)谷歌一直在研發(fā)大模型。

2023年,谷歌前后就發(fā)布了不下3個大模型,直到年底的Gemini才實(shí)現(xiàn)穩(wěn)定的對外服務(wù)。

2023年12月,當(dāng)世界還在驚嘆于GPT-4的強(qiáng)大時,谷歌悄然推出了Gemini。這個被中文稱為“雙子座”的大模型,如同一顆新星在AI的夜空中升起,它擁有三個不同尺寸的版本:Ultra、Pro和Nano,每一款都內(nèi)置了最強(qiáng)大的自研AI超算芯片Cloud TPU v5p。

在六項(xiàng)基準(zhǔn)測試中,Gemini Pro已經(jīng)展現(xiàn)出了超越GPT-3.5的實(shí)力;而在更為嚴(yán)苛的30項(xiàng)性能基準(zhǔn)測試中,Gemini Ultra更是力壓群雄,超越了當(dāng)前的王者GPT-4。令人震驚的是,在數(shù)學(xué)、物理、法律等57個領(lǐng)域的測試中,Gemini竟然成為了全球第一個超越人類專家水平的AI模型。

這樣的成就,無疑讓谷歌對AI的未來充滿了信心。他們不僅整合了全球的AI人才和算力資源,更是全力投資Gemini的研發(fā)和推廣。

短短幾個月內(nèi),Gemini的名字頻頻出現(xiàn)在各大科技媒體的頭條。今年1月,谷歌宣布在全球一項(xiàng)大模型基準(zhǔn)測試中Gemini超越GPT-4;2月,他們又將備受關(guān)注的AI聊天機(jī)器人平臺Google Bard升級為Gemini,并推出了安卓版本的獨(dú)立App。這一系列動作,都向世界展示了谷歌在AI領(lǐng)域的決心和實(shí)力。

而Gemini的強(qiáng)大之處,并不僅僅在于它的性能。更重要的是,它是一個真正原生的多模態(tài)大模型。這意味著它可以輕松處理文本、圖像、音頻和視頻等多種模態(tài)的信息,打破了傳統(tǒng)AI模型在處理多模態(tài)數(shù)據(jù)時的局限。

在一段公布的演示視頻中,谷歌CEO桑達(dá)爾·皮查伊展示了Gemini驚人的識別能力。它可以自如地在圖像、音頻、視頻各模態(tài)之間轉(zhuǎn)換,無論是描述一幅畫的細(xì)節(jié),還是根據(jù)一段音樂生成相應(yīng)的視頻,都顯得游刃有余。

這樣的技術(shù)突破,無疑為AI的應(yīng)用場景打開了新的大門。在智能營銷領(lǐng)域,Gemini的推出已經(jīng)進(jìn)一步優(yōu)化用戶體驗(yàn)和成本。無論是文本、圖片還是視頻,都將進(jìn)入“能聽會看”的時代。廣告商可以利用Gemini生成個性化的媒體資產(chǎn),而YouTube創(chuàng)作者則可以獲得制作視頻的建議和靈感。甚至,連谷歌內(nèi)部的員工也在使用名為“Goose”的AI大語言模型來提高工作效率和編寫代碼的速度。

當(dāng)然,谷歌的野心并不止于此。他們正在將Gemini與谷歌服務(wù)中的其他產(chǎn)品集成,包括Chrome、搜索和廣告等。這意味著,在不久的將來,我們或許可以在Chrome瀏覽器中直接體驗(yàn)到Gemini的強(qiáng)大功能;在搜索時,Gemini可以幫助我們更準(zhǔn)確地理解和組織文本信息;而在觀看廣告時,Gemini則可以根據(jù)我們的興趣和需求推薦更加個性化的內(nèi)容。

某種意義上,AI的注入給谷歌帶來了無限的希望和可能。而Gemini的誕生更是讓這家科技巨頭在未來的競爭中占據(jù)了有利地位。

接下來的戰(zhàn)役更血腥

大模型領(lǐng)域的技術(shù)競爭目前看好像沒有止境。在AI的戰(zhàn)場上,硝煙從未如此濃烈。

2月中旬,當(dāng)谷歌的Gemini 1.5還在為人們展示其深邃的星辰之力時,OpenAI的全新視頻生成模型Sora如彗星般劃過天際,瞬間奪走了所有的光芒。一時間,Sora成為了人們口中的新寵,而谷歌的努力似乎被這場突如其來的“星光”所掩蓋。

然而,谷歌并未就此沉寂。不到半個月的時間,它攜帶著全新的開源模型Gemma重返戰(zhàn)場,誓要奪回屬于自己的榮耀。Gemma,這個在拉丁語中意為“寶石”的名字,似乎預(yù)示著谷歌將再次閃耀。

與ChaGPT和Gemini相比,Gemma或許更適合處理那些小巧而精致的任務(wù),比如簡單的AI聊天或摘要生成。但別小看它,因?yàn)樵谶@背后,是谷歌對模型架構(gòu)、性能表現(xiàn)、自研芯片、訓(xùn)練基礎(chǔ)設(shè)施等多個方面的全面升級和打磨。

Gemma采用了與Gemini相同的技術(shù)架構(gòu),主打開源和輕量級。它不僅免費(fèi)可用、模型權(quán)重開源、允許商用,更重要的是,它可以在筆記本上運(yùn)行。這無疑為那些想要體驗(yàn)AI魅力但又苦于沒有高性能設(shè)備的用戶打開了一扇大門。

共有2B和7B兩個版本的Gemma,在性能上全面超越了開源標(biāo)桿Llama 2。發(fā)布僅僅幾個小時,它就火速成為了圈內(nèi)最熱門的話題。Keras的作者Fran?ois Chollet更是毫不吝嗇地稱贊它為“最強(qiáng)開源大模型”。

而谷歌的野心并不止于此。他們還強(qiáng)調(diào),Gemma能在關(guān)鍵基準(zhǔn)上越級碾壓更大的模型。這意味著,即使面對那些規(guī)模更大、更復(fù)雜的競爭對手,Gemma也能展現(xiàn)出強(qiáng)大的實(shí)力。

當(dāng)然,這場戰(zhàn)斗并不是谷歌單方面的秀場。Meta的Llama 3也發(fā)布在即,扎克伯格已經(jīng)宣布了這一消息,并表示將繼續(xù)以負(fù)責(zé)任的方式開源。這無疑給谷歌的Gemma帶來了不小的壓力。但谷歌似乎并不懼怕競爭,反而希望通過這次開源吸引更多的人使用自己的AI模型,而不是直接投奔競爭對手。

谷歌這次沒有預(yù)告的開源舉動,或許是想搶在Meta的Llama 3之前占據(jù)先機(jī)。畢竟,在AI的戰(zhàn)場上,時間就是金錢,速度就是生命。而谷歌的AI技術(shù)更新迭代之快,確實(shí)讓人始料未及。三個月內(nèi)連續(xù)發(fā)布三款大模型系列,這樣的速度和效率讓人不得不佩服谷歌在AI領(lǐng)域的深厚實(shí)力。

OpenAI的CEO奧特曼曾私下表示,與谷歌相比,OpenAI在算力上處于劣勢。這無疑是谷歌在AI三要素(算力、算法、數(shù)據(jù))中具有明顯技術(shù)領(lǐng)先優(yōu)勢的一個縮影。如今,隨著Gemini和Gemma模型的連續(xù)發(fā)布,谷歌在開源和閉源方向上的全面覆蓋更是暴露了其成為“AI行業(yè)王者”的野心。

華爾街預(yù)計,接下來Gemma將成為開源社區(qū)的關(guān)注焦點(diǎn)。谷歌開發(fā)者X副總裁兼總經(jīng)理、谷歌開發(fā)者關(guān)系主管Jeanine Banks認(rèn)為,Gemma模型是谷歌從TensorFlow等工具開源AI開發(fā)技術(shù)的歷史的延續(xù)的最新AI系統(tǒng)。從PaLM2、AlphaFold到Gemini,最后形成了Gemma。這一系列的進(jìn)化歷程充分展示了谷歌在AI領(lǐng)域的深厚底蘊(yùn)和持續(xù)創(chuàng)新的能力。

“我們認(rèn)為,如果谷歌能夠成為API和開放模型的唯一提供商,為社區(qū)提供最廣泛的功能集,那就完美了。”Jeanine Banks的話語中透露出了對谷歌未來的期待和信心。而這場關(guān)于AI的較量,也才剛剛開始而已。

接下來,我們就看“跌落神壇”的開源模型Meta Llama如何再接招了,當(dāng)然,還有OpenAI的那個“光之巨人”奧特曼。

無疑,這將是一場更加血腥的競爭。而最終贏得戰(zhàn)爭的巨頭,可能才會真正吃到大模型發(fā)展的最終紅利。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

谷歌

6.2k
  • 高通與谷歌達(dá)成多年戰(zhàn)略合作,將提供生成式AI數(shù)字座艙解決方案
  • 霍尼韋爾與谷歌達(dá)成協(xié)議,將Gemini引入工業(yè)領(lǐng)域

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

為什么說谷歌才是吃到大模型紅利的科技巨頭?

在AI的戰(zhàn)場上,硝煙從未如此濃烈。

圖片來源:界面新聞 匡達(dá)

文|BT財經(jīng) Rickzhang

近日,谷歌發(fā)布了令人矚目的2023年財報。

雖然谷歌推出的抗衡Gpt4大模型的Gemini,在去年12月份才正式上線。但谷歌實(shí)際上在自己業(yè)務(wù)體系中,早已將大模型的能力深度與業(yè)務(wù)捆綁。

相關(guān)新聞報道顯示,跟李彥宏不遺余力推動文心大模型與百度各項(xiàng)業(yè)務(wù)融合一樣,在去年的上半年,谷歌內(nèi)部已經(jīng)開啟了用谷歌推出大模型原型對谷歌業(yè)務(wù)進(jìn)行深度整理和升級。

尤其在谷歌最引為支柱的廣告與谷歌云服務(wù)上。

結(jié)果就是云服務(wù)經(jīng)歷了從2022年開始的低潮和虧損,到2023年四季度實(shí)現(xiàn)了整體盈利;而谷歌的廣告業(yè)務(wù),也從以往個位數(shù)的增長變成全年增長超過了10%。

據(jù)路透社報道,谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)表示,生成式人工智能正在推動云計算的增長。谷歌云最近一個季度的收入為92億美元,超過了預(yù)期的89億美元。這標(biāo)志著云收入增長從上一季度重新加速至25.7%。

在這樣的背景下,谷歌2023年的財報數(shù)據(jù)更是亮眼。全年歸屬于普通股東的凈利潤達(dá)到737.95億美元,同比增長23.05%,營業(yè)收入也同比增長8.68%,達(dá)到3073.94億美元。尤其是公司四季度,歸屬于普通股東的凈利潤同比增長高達(dá)51.84%,營業(yè)收入也實(shí)現(xiàn)了13.49%的同比增長。這一系列數(shù)字,無疑是谷歌強(qiáng)大盈利能力的最好證明。

與此同時,當(dāng)我們將目光轉(zhuǎn)向其他科技巨頭時,會發(fā)現(xiàn)谷歌的表現(xiàn)更加難能可貴。OpenAI,作為大模型的先驅(qū)者之一,至今仍未找到盈利的出口;而扎克伯格投入巨資打造的大模型,每個季度還要面臨十幾億美元的虧損。相比之下,谷歌的盈利增長不僅穩(wěn)健而且強(qiáng)勁,這無疑說明他們可能已經(jīng)成為了西方科技巨頭中第一個吃到大模型紅利的企業(yè)。

微軟雖然在2023年實(shí)現(xiàn)了云服務(wù)的高速增長,但如果我們將微軟給OpenAI提供的近150億美元資金支持考慮在內(nèi),那么微軟在大模型上的投入實(shí)際上依然沒有看到盈利的曙光。

這讓谷歌現(xiàn)在的表現(xiàn)有些鶴立雞群。

一份出乎意料的財報

在科技江湖中,每一份財報都如同高手過招的秘籍,透露著企業(yè)的內(nèi)力修為與未來走向。當(dāng)?shù)貢r間2024年1月30日,谷歌母公司Alphabet亮出了自己的2023年財報,一時間風(fēng)起云涌,吸引了無數(shù)眼球。

這不僅僅是一份財報,更像是一部跌宕起伏的科技傳奇。Alphabet的業(yè)績?nèi)缤^山車一般,讓人驚嘆不已。

截至2023年12月31日的三個月內(nèi),Alphabet的季度合并收入高達(dá)863.1億美元,同比增長了驚人的13%。公司實(shí)現(xiàn)凈利潤更是飆升至206.9億美元,相比前一年同期的136億美元,增長了整整52%。而全年來看,Alphabet的合并收入更是達(dá)到了驚人的3073.9億美元,同比增長9%,凈利潤也高達(dá)738億美元。

在這份財報中,最引人注目的莫過于谷歌云業(yè)務(wù)的華麗轉(zhuǎn)身。曾幾何時,谷歌云還在虧損的泥潭中掙扎,連續(xù)四個季度虧損總額超過19億美元。然而,在2023年,它如同鳳凰涅槃一般,不僅成功扭虧為盈,還實(shí)現(xiàn)了超過17億美元的盈利。這樣的轉(zhuǎn)變,讓人不禁對谷歌云的未來充滿了期待。

這背后的功臣,非生成式AI莫屬。在2023年的熱潮中,谷歌緊跟時代步伐,連續(xù)四個季度研發(fā)投入同比增長8%到26%不等。全年研發(fā)費(fèi)用高達(dá)454億美元,比上一年多投入了整整59億美元。這樣的投入力度,足以彰顯谷歌在AI領(lǐng)域的決心和野心。

與此同時,谷歌在投資方面也毫不吝嗇。2023年,谷歌用于投資活動的現(xiàn)金凈額超過了270億美元,比上一年增加了67.7億美元。其中,最引人矚目的莫過于對初創(chuàng)公司Anthropic的20億美元追投。這家公司研發(fā)的大模型Claude,被視為ChatGPT的最強(qiáng)競品。谷歌的這一舉動,無疑是在AI領(lǐng)域布下了一枚重要的棋子。

在這份財報中,廣告業(yè)務(wù)的表現(xiàn)也同樣搶眼。盡管面臨著各種挑戰(zhàn)和競爭,但谷歌的廣告業(yè)務(wù)依然如同常青樹一般,保持著穩(wěn)健的增長勢頭。2023年第四季度,廣告業(yè)務(wù)的營收達(dá)到了655億美元,同比增長了12%。這樣的成績,足以證明谷歌在廣告市場的深厚實(shí)力和無法撼動的地位。

當(dāng)然,云計算市場也是谷歌的重要戰(zhàn)場之一。雖然目前谷歌云在全球市場份額上排名第三,落后于亞馬遜和微軟。但本季度的業(yè)績表明,谷歌云已經(jīng)開始發(fā)力,首次實(shí)現(xiàn)了全年盈利。而且,其營收增速接近26%,甚至超過了微軟云業(yè)務(wù)同期的增速20%。在大模型的支持下,谷歌云第四季度贏得了全球云服務(wù)市場11%的份額。這樣的表現(xiàn),足以讓人對谷歌云的未來充滿期待。

這份財報的發(fā)布,無疑給那些對谷歌持懷疑態(tài)度的人一記響亮的耳光。面對微軟的步步緊逼和OpenAI的崛起,谷歌沒有選擇坐以待斃,而是積極應(yīng)對,加大研發(fā)投入和投資布局。如今,這份出乎意料的財報就是最好的證明。

值得一提的是,在這份財報發(fā)布之際,谷歌的聯(lián)合創(chuàng)始人謝爾蓋·布林也開始越來越多地參與到Alphabet的人工智能發(fā)展中來。這位曾經(jīng)“歸隱山林”的傳奇人物如今重出江湖,無疑給谷歌的未來發(fā)展增添了一份神秘色彩和無限可能。

AI的注入帶來希望

其實(shí)谷歌一直在研發(fā)大模型。

2023年,谷歌前后就發(fā)布了不下3個大模型,直到年底的Gemini才實(shí)現(xiàn)穩(wěn)定的對外服務(wù)。

2023年12月,當(dāng)世界還在驚嘆于GPT-4的強(qiáng)大時,谷歌悄然推出了Gemini。這個被中文稱為“雙子座”的大模型,如同一顆新星在AI的夜空中升起,它擁有三個不同尺寸的版本:Ultra、Pro和Nano,每一款都內(nèi)置了最強(qiáng)大的自研AI超算芯片Cloud TPU v5p。

在六項(xiàng)基準(zhǔn)測試中,Gemini Pro已經(jīng)展現(xiàn)出了超越GPT-3.5的實(shí)力;而在更為嚴(yán)苛的30項(xiàng)性能基準(zhǔn)測試中,Gemini Ultra更是力壓群雄,超越了當(dāng)前的王者GPT-4。令人震驚的是,在數(shù)學(xué)、物理、法律等57個領(lǐng)域的測試中,Gemini竟然成為了全球第一個超越人類專家水平的AI模型。

這樣的成就,無疑讓谷歌對AI的未來充滿了信心。他們不僅整合了全球的AI人才和算力資源,更是全力投資Gemini的研發(fā)和推廣。

短短幾個月內(nèi),Gemini的名字頻頻出現(xiàn)在各大科技媒體的頭條。今年1月,谷歌宣布在全球一項(xiàng)大模型基準(zhǔn)測試中Gemini超越GPT-4;2月,他們又將備受關(guān)注的AI聊天機(jī)器人平臺Google Bard升級為Gemini,并推出了安卓版本的獨(dú)立App。這一系列動作,都向世界展示了谷歌在AI領(lǐng)域的決心和實(shí)力。

而Gemini的強(qiáng)大之處,并不僅僅在于它的性能。更重要的是,它是一個真正原生的多模態(tài)大模型。這意味著它可以輕松處理文本、圖像、音頻和視頻等多種模態(tài)的信息,打破了傳統(tǒng)AI模型在處理多模態(tài)數(shù)據(jù)時的局限。

在一段公布的演示視頻中,谷歌CEO桑達(dá)爾·皮查伊展示了Gemini驚人的識別能力。它可以自如地在圖像、音頻、視頻各模態(tài)之間轉(zhuǎn)換,無論是描述一幅畫的細(xì)節(jié),還是根據(jù)一段音樂生成相應(yīng)的視頻,都顯得游刃有余。

這樣的技術(shù)突破,無疑為AI的應(yīng)用場景打開了新的大門。在智能營銷領(lǐng)域,Gemini的推出已經(jīng)進(jìn)一步優(yōu)化用戶體驗(yàn)和成本。無論是文本、圖片還是視頻,都將進(jìn)入“能聽會看”的時代。廣告商可以利用Gemini生成個性化的媒體資產(chǎn),而YouTube創(chuàng)作者則可以獲得制作視頻的建議和靈感。甚至,連谷歌內(nèi)部的員工也在使用名為“Goose”的AI大語言模型來提高工作效率和編寫代碼的速度。

當(dāng)然,谷歌的野心并不止于此。他們正在將Gemini與谷歌服務(wù)中的其他產(chǎn)品集成,包括Chrome、搜索和廣告等。這意味著,在不久的將來,我們或許可以在Chrome瀏覽器中直接體驗(yàn)到Gemini的強(qiáng)大功能;在搜索時,Gemini可以幫助我們更準(zhǔn)確地理解和組織文本信息;而在觀看廣告時,Gemini則可以根據(jù)我們的興趣和需求推薦更加個性化的內(nèi)容。

某種意義上,AI的注入給谷歌帶來了無限的希望和可能。而Gemini的誕生更是讓這家科技巨頭在未來的競爭中占據(jù)了有利地位。

接下來的戰(zhàn)役更血腥

大模型領(lǐng)域的技術(shù)競爭目前看好像沒有止境。在AI的戰(zhàn)場上,硝煙從未如此濃烈。

2月中旬,當(dāng)谷歌的Gemini 1.5還在為人們展示其深邃的星辰之力時,OpenAI的全新視頻生成模型Sora如彗星般劃過天際,瞬間奪走了所有的光芒。一時間,Sora成為了人們口中的新寵,而谷歌的努力似乎被這場突如其來的“星光”所掩蓋。

然而,谷歌并未就此沉寂。不到半個月的時間,它攜帶著全新的開源模型Gemma重返戰(zhàn)場,誓要奪回屬于自己的榮耀。Gemma,這個在拉丁語中意為“寶石”的名字,似乎預(yù)示著谷歌將再次閃耀。

與ChaGPT和Gemini相比,Gemma或許更適合處理那些小巧而精致的任務(wù),比如簡單的AI聊天或摘要生成。但別小看它,因?yàn)樵谶@背后,是谷歌對模型架構(gòu)、性能表現(xiàn)、自研芯片、訓(xùn)練基礎(chǔ)設(shè)施等多個方面的全面升級和打磨。

Gemma采用了與Gemini相同的技術(shù)架構(gòu),主打開源和輕量級。它不僅免費(fèi)可用、模型權(quán)重開源、允許商用,更重要的是,它可以在筆記本上運(yùn)行。這無疑為那些想要體驗(yàn)AI魅力但又苦于沒有高性能設(shè)備的用戶打開了一扇大門。

共有2B和7B兩個版本的Gemma,在性能上全面超越了開源標(biāo)桿Llama 2。發(fā)布僅僅幾個小時,它就火速成為了圈內(nèi)最熱門的話題。Keras的作者Fran?ois Chollet更是毫不吝嗇地稱贊它為“最強(qiáng)開源大模型”。

而谷歌的野心并不止于此。他們還強(qiáng)調(diào),Gemma能在關(guān)鍵基準(zhǔn)上越級碾壓更大的模型。這意味著,即使面對那些規(guī)模更大、更復(fù)雜的競爭對手,Gemma也能展現(xiàn)出強(qiáng)大的實(shí)力。

當(dāng)然,這場戰(zhàn)斗并不是谷歌單方面的秀場。Meta的Llama 3也發(fā)布在即,扎克伯格已經(jīng)宣布了這一消息,并表示將繼續(xù)以負(fù)責(zé)任的方式開源。這無疑給谷歌的Gemma帶來了不小的壓力。但谷歌似乎并不懼怕競爭,反而希望通過這次開源吸引更多的人使用自己的AI模型,而不是直接投奔競爭對手。

谷歌這次沒有預(yù)告的開源舉動,或許是想搶在Meta的Llama 3之前占據(jù)先機(jī)。畢竟,在AI的戰(zhàn)場上,時間就是金錢,速度就是生命。而谷歌的AI技術(shù)更新迭代之快,確實(shí)讓人始料未及。三個月內(nèi)連續(xù)發(fā)布三款大模型系列,這樣的速度和效率讓人不得不佩服谷歌在AI領(lǐng)域的深厚實(shí)力。

OpenAI的CEO奧特曼曾私下表示,與谷歌相比,OpenAI在算力上處于劣勢。這無疑是谷歌在AI三要素(算力、算法、數(shù)據(jù))中具有明顯技術(shù)領(lǐng)先優(yōu)勢的一個縮影。如今,隨著Gemini和Gemma模型的連續(xù)發(fā)布,谷歌在開源和閉源方向上的全面覆蓋更是暴露了其成為“AI行業(yè)王者”的野心。

華爾街預(yù)計,接下來Gemma將成為開源社區(qū)的關(guān)注焦點(diǎn)。谷歌開發(fā)者X副總裁兼總經(jīng)理、谷歌開發(fā)者關(guān)系主管Jeanine Banks認(rèn)為,Gemma模型是谷歌從TensorFlow等工具開源AI開發(fā)技術(shù)的歷史的延續(xù)的最新AI系統(tǒng)。從PaLM2、AlphaFold到Gemini,最后形成了Gemma。這一系列的進(jìn)化歷程充分展示了谷歌在AI領(lǐng)域的深厚底蘊(yùn)和持續(xù)創(chuàng)新的能力。

“我們認(rèn)為,如果谷歌能夠成為API和開放模型的唯一提供商,為社區(qū)提供最廣泛的功能集,那就完美了?!盝eanine Banks的話語中透露出了對谷歌未來的期待和信心。而這場關(guān)于AI的較量,也才剛剛開始而已。

接下來,我們就看“跌落神壇”的開源模型Meta Llama如何再接招了,當(dāng)然,還有OpenAI的那個“光之巨人”奧特曼。

無疑,這將是一場更加血腥的競爭。而最終贏得戰(zhàn)爭的巨頭,可能才會真正吃到大模型發(fā)展的最終紅利。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。