正在閱讀:

文心大模型日均調(diào)用量超7億,百度竭力為其尋找落地機(jī)會

掃一掃下載界面新聞APP

文心大模型日均調(diào)用量超7億,百度竭力為其尋找落地機(jī)會

大模型工具的性能提升固然重要,但對于百度來說,模型落地的成果更具有現(xiàn)實(shí)意義。

圖片來源:官方

界面新聞?dòng)浾?| 崔鵬

界面新聞編輯 | 宋佳楠

925上午,百度在云智大會上推出百舸AI異構(gòu)計(jì)算平臺4.0千帆大模型平臺3.0AI基礎(chǔ)設(shè)施產(chǎn)品并公布多項(xiàng)AI相關(guān)業(yè)務(wù)最新數(shù)據(jù)。其中,文心大模型日均調(diào)用已經(jīng)超過7距離百度上次公布6數(shù)據(jù)進(jìn)一步提升。

剛結(jié)束的阿里云棲大會,阿里巴巴CEO吳永銘表示,阿里云單網(wǎng)絡(luò)集群已經(jīng)拓展至10級別,百度也不甘于落后。百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖特別強(qiáng)調(diào)百舸4.0不僅僅萬卡集群,而是具備了成熟的10集群部署管理能力

百度今年一直在強(qiáng)調(diào)大模型落地應(yīng)用。百度CEO李彥宏在最近一次內(nèi)部講話中表示具備應(yīng)用場景、能夠持續(xù)迭代升級大模型,與其它模型產(chǎn)品的差距會越來越大。

基于此,百度找來了長安汽車三星大量客戶為其站臺,以展示百度大模型在各行各業(yè)的落地應(yīng)用成果。

沈抖表示,過去一年,百度感受到客戶模型需求猛增,需要的集群規(guī)模越來越大,企業(yè)模型推理成本下降預(yù)期越來越高

訓(xùn)練大模型的前提是創(chuàng)建集群,這并非簡單地買來GPU組裝即可,通常需要幾個(gè)月的時(shí)間進(jìn)行設(shè)備配置調(diào)試。

此前有云廠商提到,組建集群可以壓縮1,而沈抖,百舸4.0能夠做到最快1小時(shí)完成組建,主要采用業(yè)界流行訓(xùn)練工具框架進(jìn)行內(nèi)置的方式。

一旦進(jìn)入到大規(guī)模訓(xùn)練階段最重要的就是穩(wěn)定性。大模型領(lǐng)域一直遵循著名的Scaling Law(尺度定律),認(rèn)為模型性能會隨著參數(shù)、算力和數(shù)據(jù)集的規(guī)模增加而提高

根據(jù)沈抖的說法,GPU集群需要耗費(fèi)巨額建設(shè)和運(yùn)營成本,通常建設(shè)一個(gè)萬卡集群,GPU采購成本高達(dá)幾十億元。如果10集群,服務(wù)器一天消耗電量大約300千瓦時(shí)相當(dāng)于北京東城區(qū)一天居民用電量。

這種大規(guī)模集群上硬件不可避免出現(xiàn)故障,規(guī)模越大出故障的概率越高。這些故障中絕大多數(shù)GPU引起的,因?yàn)?/span>GPU非常敏感的硬件,溫度、濕度環(huán)境波動(dòng)反應(yīng)靈敏

沈抖提到,Meta訓(xùn)練Llama3模型時(shí),用了1.6萬張GPU卡的集群,平均每3小時(shí)就會出一次故障。

大模型的訓(xùn)練龐大的單一任務(wù)一個(gè)節(jié)點(diǎn)出錯(cuò),整個(gè)集群就需要停下,回滾上一個(gè)記憶點(diǎn)。考慮到GPU集群成本非常昂貴,一分鐘就會白白燒錢,有效訓(xùn)練時(shí)長”便成為非常重要的指標(biāo)

針對大模型訓(xùn)練過程中故障頻發(fā)問題,百舸4.0故障檢測手段自動(dòng)容錯(cuò)機(jī)制進(jìn)行升級目前萬卡集群有效訓(xùn)練時(shí)長達(dá)到99.5%,沈抖這高于同行對手數(shù)據(jù)表現(xiàn)。此外,百舸4.0主流的長文本推理效率提升1以上同時(shí)降低了推理成本。

在百度最新的財(cái)報(bào)電話會上,李彥宏透露,二季度百度智能云AI貢獻(xiàn)的收入占比進(jìn)一步提升至9%,而上一季度為6.9%。

大模型工具性能提升固然重要但對于百度來說,模型落地成果更具有現(xiàn)實(shí)意義

除升級百舸平臺外,百度還著重介紹了最新的千帆3.0平臺。根據(jù)沈抖公布的數(shù)據(jù),在千帆大模型平臺上,文心大模型日均調(diào)用量超過7億次,累計(jì)幫助用戶精調(diào)了3萬個(gè)大模型,開發(fā)出70多萬個(gè)企業(yè)級應(yīng)用。千帆3.0可調(diào)用包括文心系列大模型在內(nèi)的近百個(gè)國內(nèi)外大模型,也支持調(diào)用語音、視覺等各種傳統(tǒng)的小模型。

目前,大模型落地三大主要需求分別是應(yīng)用開發(fā)模型推理模型開發(fā)。

應(yīng)用開發(fā)層企業(yè)級RAG企業(yè)行業(yè)數(shù)據(jù)做成外掛知識庫大模型Agent智能體兩大常見大模型落地場景。

其中,智能體接到任務(wù)后,會進(jìn)行自主思考、任務(wù)拆解、方案規(guī)劃,并調(diào)用工具,全程自主進(jìn)行,能夠完成過往需要3到4個(gè)APP才能完成的任務(wù)

沈抖表示,百度內(nèi)部千帆平臺提供百度搜百度地圖超過80個(gè)官方組件用來提升智能體特定任務(wù)上的能力。

而在李彥宏看來,智能體是大模型發(fā)展的下一個(gè)重要方向。“有很多人看好智能體這個(gè)發(fā)展方向,但是到今天為止,智能體還不是共識,像百度這樣把智能體作為大模型最重要的戰(zhàn)略、最重要的發(fā)展方向的公司并不多。”

百度在今年的Create大會上曾發(fā)布過三款產(chǎn)品,分別是AgentBuilder、AppBuilder和ModelBuilder。其中,AgentBuilder和AppBuilder都與智能體相關(guān),一個(gè)門檻更低,另一個(gè)更強(qiáng)調(diào)功能性。

根據(jù)百度最新透露的數(shù)據(jù),智能體在百度生態(tài)的分發(fā)量大幅增加,7月日均分發(fā)次數(shù)超800萬次,為5月數(shù)據(jù)的兩倍。

百度旗下數(shù)字人平臺智能客服產(chǎn)品也有了最新進(jìn)展其中曦靈數(shù)字人平臺4.0,支持根據(jù)文字快速生成不同妝造、不同行業(yè)特色的3D數(shù)字人形象和視頻,并將3D超寫實(shí)數(shù)字人的價(jià)格從萬元降至199元。

智能客服產(chǎn)品“客悅”則在用戶意圖理解、多模態(tài)信息交流等方面進(jìn)行了優(yōu)化,提升了處理復(fù)雜問題的能力。

按照百度的說法,目前業(yè)內(nèi)“問題自主解決率”平均水平是80%,升級后“客悅”將這一指標(biāo)提升至92%。該產(chǎn)品已累計(jì)幫助企業(yè)客戶服務(wù)超過1.5億人次,交互超5億次。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

文心大模型日均調(diào)用量超7億,百度竭力為其尋找落地機(jī)會

大模型工具的性能提升固然重要,但對于百度來說,模型落地的成果更具有現(xiàn)實(shí)意義。

圖片來源:官方

界面新聞?dòng)浾?| 崔鵬

界面新聞編輯 | 宋佳楠

925上午百度在云智大會上推出百舸AI異構(gòu)計(jì)算平臺4.0千帆大模型平臺3.0AI基礎(chǔ)設(shè)施產(chǎn)品,并公布多項(xiàng)AI相關(guān)業(yè)務(wù)最新數(shù)據(jù)其中,文心大模型日均調(diào)用已經(jīng)超過7距離百度上次公布6數(shù)據(jù)進(jìn)一步提升。

剛結(jié)束的阿里云棲大會阿里巴巴CEO吳永銘表示,阿里云單網(wǎng)絡(luò)集群已經(jīng)拓展至10級別,百度也不甘于落后。百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖特別強(qiáng)調(diào),百舸4.0不僅僅萬卡集群而是具備了成熟的10集群部署管理能力。

百度今年一直在強(qiáng)調(diào)大模型落地應(yīng)用。百度CEO李彥宏在最近一次內(nèi)部講話中表示,具備應(yīng)用場景能夠持續(xù)迭代升級大模型,與其它模型產(chǎn)品的差距會越來越大。

基于此,百度找來了長安汽車三星大量客戶為其站臺,以展示百度大模型在各行各業(yè)的落地應(yīng)用成果。

沈抖表示,過去一年,百度感受到客戶模型需求猛增需要的集群規(guī)模越來越大,企業(yè)模型推理成本下降預(yù)期越來越高

訓(xùn)練大模型的前提是創(chuàng)建集群,這并非簡單地買來GPU組裝即可,通常需要幾個(gè)月的時(shí)間進(jìn)行設(shè)備配置調(diào)試。

此前有云廠商提到,組建集群可以壓縮1,而沈抖百舸4.0能夠做到最快1小時(shí)完成組建,主要采用業(yè)界流行訓(xùn)練工具框架進(jìn)行內(nèi)置的方式。

一旦進(jìn)入到大規(guī)模訓(xùn)練階段,最重要的就是穩(wěn)定性。大模型領(lǐng)域一直遵循著名的Scaling Law(尺度定律),認(rèn)為模型性能會隨著參數(shù)、算力和數(shù)據(jù)集的規(guī)模增加而提高

根據(jù)沈抖的說法,GPU集群需要耗費(fèi)巨額建設(shè)和運(yùn)營成本,通常建設(shè)一個(gè)萬卡集群,GPU采購成本高達(dá)幾十億元。如果10集群,服務(wù)器一天消耗電量大約300千瓦時(shí),相當(dāng)于北京東城區(qū)一天居民用電量。

這種大規(guī)模集群上硬件不可避免出現(xiàn)故障,規(guī)模越大出故障的概率越高。這些故障中絕大多數(shù)GPU引起的,因?yàn)?/span>GPU非常敏感的硬件溫度、濕度環(huán)境波動(dòng)反應(yīng)靈敏

沈抖提到,Meta訓(xùn)練Llama3模型時(shí),用了1.6萬張GPU卡的集群,平均每3小時(shí)就會出一次故障。

大模型的訓(xùn)練龐大的單一任務(wù),一個(gè)節(jié)點(diǎn)出錯(cuò),整個(gè)集群就需要停下,回滾上一個(gè)記憶點(diǎn)。考慮到GPU集群成本非常昂貴一分鐘就會白白燒錢,有效訓(xùn)練時(shí)長”便成為非常重要的指標(biāo)

針對大模型訓(xùn)練過程中故障頻發(fā)問題,百舸4.0故障檢測手段自動(dòng)容錯(cuò)機(jī)制進(jìn)行升級,目前萬卡集群有效訓(xùn)練時(shí)長達(dá)到99.5%,沈抖這高于同行對手數(shù)據(jù)表現(xiàn)。此外,百舸4.0主流的長文本推理效率提升1以上同時(shí)降低了推理成本。

在百度最新的財(cái)報(bào)電話會上,李彥宏透露,二季度百度智能云AI貢獻(xiàn)的收入占比進(jìn)一步提升至9%,而上一季度為6.9%。

大模型工具性能提升固然重要但對于百度來說,模型落地成果更具有現(xiàn)實(shí)意義。

除升級百舸平臺外,百度還著重介紹了最新的千帆3.0平臺。根據(jù)沈抖公布的數(shù)據(jù),在千帆大模型平臺上,文心大模型日均調(diào)用量超過7億次,累計(jì)幫助用戶精調(diào)了3萬個(gè)大模型,開發(fā)出70多萬個(gè)企業(yè)級應(yīng)用。千帆3.0可調(diào)用包括文心系列大模型在內(nèi)的近百個(gè)國內(nèi)外大模型,也支持調(diào)用語音、視覺等各種傳統(tǒng)的小模型。

目前,大模型落地三大主要需求分別是應(yīng)用開發(fā)、模型推理模型開發(fā)

應(yīng)用開發(fā)層,企業(yè)級RAG企業(yè)行業(yè)數(shù)據(jù)做成外掛知識庫大模型Agent智能體兩大常見大模型落地場景

其中,智能體接到任務(wù)后,會進(jìn)行自主思考、任務(wù)拆解、方案規(guī)劃,并調(diào)用工具,全程自主進(jìn)行,能夠完成過往需要3到4個(gè)APP才能完成的任務(wù)。

沈抖表示,百度內(nèi)部千帆平臺提供百度搜百度地圖超過80個(gè)官方組件用來提升智能體特定任務(wù)上的能力。

而在李彥宏看來,智能體是大模型發(fā)展的下一個(gè)重要方向。“有很多人看好智能體這個(gè)發(fā)展方向,但是到今天為止,智能體還不是共識,像百度這樣把智能體作為大模型最重要的戰(zhàn)略、最重要的發(fā)展方向的公司并不多?!?/span>

百度在今年的Create大會上曾發(fā)布過三款產(chǎn)品,分別是AgentBuilder、AppBuilder和ModelBuilder。其中,AgentBuilder和AppBuilder都與智能體相關(guān),一個(gè)門檻更低,另一個(gè)更強(qiáng)調(diào)功能性。

根據(jù)百度最新透露的數(shù)據(jù),智能體在百度生態(tài)的分發(fā)量大幅增加,7月日均分發(fā)次數(shù)超800萬次,為5月數(shù)據(jù)的兩倍。

百度旗下數(shù)字人平臺智能客服產(chǎn)品也有了最新進(jìn)展。其中曦靈數(shù)字人平臺4.0,支持根據(jù)文字快速生成不同妝造、不同行業(yè)特色的3D數(shù)字人形象和視頻,并將3D超寫實(shí)數(shù)字人的價(jià)格從萬元降至199元。

智能客服產(chǎn)品“客悅”則在用戶意圖理解、多模態(tài)信息交流等方面進(jìn)行了優(yōu)化,提升了處理復(fù)雜問題的能力。

按照百度的說法,目前業(yè)內(nèi)“問題自主解決率”平均水平是80%,升級后“客悅”將這一指標(biāo)提升至92%。該產(chǎn)品已累計(jì)幫助企業(yè)客戶服務(wù)超過1.5億人次,交互超5億次。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。