正在閱讀:

Sora來了,字節(jié)發(fā)力:張楠的重任和挑戰(zhàn)

掃一掃下載界面新聞APP

Sora來了,字節(jié)發(fā)力:張楠的重任和挑戰(zhàn)

壓力給到了剪映。

文|連線Insight 王慧瑩

編輯|子夜

OpenAI再次引發(fā)全球注目。

北京時(shí)間2月16日,OpenAI發(fā)布了文生視頻大模型Sora。從官方介紹看,Sora能夠根據(jù)文本提示創(chuàng)建詳細(xì)的視頻,擴(kuò)展現(xiàn)有視頻中的敘述以及從靜態(tài)圖像生成場景,最長能生成60秒視頻。

這熟悉的一幕,讓人夢回2023年。彼時(shí),ChatGPT引發(fā)了大模型的浪潮,掀起了全球范圍內(nèi)的AI軍備競賽。到了今年,OpenAI再次扔出一枚石子,在文生視頻的池子里激起漣漪。

Sora讓“一句話生成視頻”變成可能,這是一場人工智能改變視頻制作的革命,全球短視頻巨頭字節(jié)跳動(dòng)也不能忽視這個(gè)浪潮。

巧合的是,Sora問世一周前,字節(jié)跳動(dòng)宣布了一項(xiàng)人事變動(dòng),原抖音集團(tuán)CEO張楠宣布,自己已經(jīng)辭去集團(tuán)CEO一職,未來把精力聚焦在剪映的發(fā)展上。字節(jié)跳動(dòng)CEO梁汝波表示,感謝張楠過去帶領(lǐng)中國信息平臺(tái)業(yè)務(wù)做出的貢獻(xiàn)和突破,期待她在新崗位上再接再厲。

作為元老級員工,張楠已經(jīng)加入字節(jié)跳動(dòng)十年整,主導(dǎo)推出了抖音、火山等產(chǎn)品。她帶領(lǐng)抖音完成了對競爭對手的反超,成為字節(jié)跳動(dòng)實(shí)現(xiàn)二次飛躍的關(guān)鍵人物。如今,抖音的日活已經(jīng)超過6.5億,成為全球范圍內(nèi)短視頻領(lǐng)域的佼佼者。

高層的變動(dòng)常常伴隨業(yè)務(wù)的調(diào)整,讓最熟悉抖音生態(tài)的人來負(fù)責(zé)剪映,字節(jié)跳動(dòng)的目標(biāo)很明確,要在AI文生視頻制作方面抓住新的爆發(fā)機(jī)遇。

據(jù)時(shí)代周報(bào)報(bào)道,接近剪映的人士透露,過去一年,張楠已經(jīng)把絕大多數(shù)精力傾斜到剪映先關(guān)的業(yè)務(wù)上,并親自帶隊(duì)尋求在AI輔助創(chuàng)作上有所突破,并即將推出一個(gè)AI生成和視頻的產(chǎn)品。

ChatGPT和Sora給字節(jié)跳動(dòng)帶來了新的啟發(fā),也帶來了更多壓力。過去一年,字節(jié)跳動(dòng)延續(xù)超級APP的邏輯,接連推出了多款基于AI技術(shù)的產(chǎn)品,分布對話、工具、互動(dòng)劇情等多個(gè)類別,包括豆包、扣子等APP。

動(dòng)作很多,但速度不快,成果不顯,這讓字節(jié)跳動(dòng)感到焦慮。年初內(nèi)部會(huì)議上,梁汝波把對技術(shù)部門的不滿表達(dá)得很直白。他說,字節(jié)跳動(dòng)居然直到2023年才開始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司都是在2018年至2021年創(chuàng)立的。

AI風(fēng)口下,字節(jié)還沒能大力出奇跡,張楠再次擔(dān)任了沖鋒者的角色。能否帶領(lǐng)剪映再次創(chuàng)造奇跡,對張楠和字節(jié)跳動(dòng)來說至關(guān)重要,這決定了字節(jié)跳動(dòng)能否走出增長困境,尋找到新的生機(jī)。

1、Sora來了,壓力給到了字節(jié)跳動(dòng)

一位時(shí)尚女性走在充滿溫暖霓虹燈和動(dòng)畫城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包;她戴著太陽鏡,涂著紅色口紅;她走路自信又隨意……

潮濕積水的街道倒映著上空的影像、女性皮膚上的毛孔清晰可見,如此逼真寫實(shí)的視頻畫面,出自AI之手。

Sora示例視頻,來源OpenAI官網(wǎng)

沒有任何預(yù)告,OpenAI再放大招。北京時(shí)間2月16日OpenAI在社交平臺(tái)X發(fā)帖,首次對外公布了名為Sora的文生視頻AI模型。

Sora帶來的震撼,不亞于去年的ChatGPT,瞬時(shí)成為開年最火爆的話題之一。

事實(shí)上,文生視頻并非新鮮事物。在Sora發(fā)布前,根據(jù)知名投資機(jī)構(gòu)a16z統(tǒng)計(jì),截至2024年底,市場上共有21個(gè)公開的AI視頻模型,包括大眾熟知的Runway、Pika、Genmo以及Stable Video Diffusion等等。

但Sora為何會(huì)如此驚艷,并以顛覆性再次攪動(dòng)AI行業(yè)?理解力、還原力是Sora效果超預(yù)期的核心。

OpenAI官網(wǎng)上的多段視頻也證明了Sora的能力。兩艘海盜船在一杯咖啡中航行,在泛白的咖啡泡沫中互相激斗;載滿乘客的列車駛過光影交替的城市,車窗上投射出生動(dòng)的車內(nèi)倒影;舞龍隊(duì)伍在周邊人群的圍觀和隨行中前進(jìn),遠(yuǎn)近透視真實(shí)感十足。

在視頻時(shí)長上看,用戶只需要輸入一段文本,Sora就能自動(dòng)生成最長一分鐘的高清視頻。這超出了市面上的大多數(shù)產(chǎn)品。根據(jù)a16z統(tǒng)計(jì),現(xiàn)有的AI視頻模型制作的視頻長度大都在10秒以內(nèi),像此前大熱的Runway Gen 2、Pika,其制作的視頻長度分別只有4秒和3秒。

更重要的是,Sora對真實(shí)世界的理解能力和還原能力都超出了市面現(xiàn)有的大模型。

正如OpenAI在官方博客上寫道,Sora不僅可以理解用戶的需求,還知道這些事物在現(xiàn)實(shí)世界如何存在。具體而言,Sora不僅能實(shí)現(xiàn)一鏡到底,還能完成多角度鏡頭、分鏡頭的切換,更能還原真實(shí)世界中的光影反射、人類行為等。

超預(yù)期的表現(xiàn)離不開技術(shù)支撐。據(jù)OpenAI介紹,因使用Transformer架構(gòu),Sora具有極強(qiáng)的擴(kuò)展性,同時(shí)在基于過去對DALL·E和GPT的研究基礎(chǔ)構(gòu)建上還利用了DALL·E 3的重述提示詞技術(shù),為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注。

Sora的出現(xiàn)能否掀起中國乃至全球范圍新一輪的AI軍備競賽尚不可知,但能生成60s視頻的Sora,把壓力實(shí)實(shí)在在給到了字節(jié)跳動(dòng)。因?yàn)?0s視頻所處的賽道,正是字節(jié)跳動(dòng)王牌業(yè)務(wù)抖音的大本營。

在抖音生態(tài)越來越豐富后,為了服務(wù)內(nèi)容創(chuàng)作者,剪映也應(yīng)運(yùn)而生。背靠抖音的流量池,截至2021年,剪映的月活用戶已經(jīng)突破1億,是國內(nèi)最大的移動(dòng)視頻編輯產(chǎn)品。而TikTok在全球的風(fēng)靡,也帶動(dòng)了剪映海外版CapCut的下載量激增。

剪映之所以能夠如此風(fēng)靡,原因在于降低了門檻,讓普通人都能夠更快更簡單地產(chǎn)出視頻內(nèi)容。

而近兩年,隨著AIGC的火爆,視頻制作門檻將被再次降低。這也是如今Sora對剪映產(chǎn)生威脅的核心原因:更多人將傾向于選擇門檻更低,但效果更好的平臺(tái),剪映的用戶將可能被AI視頻生成產(chǎn)品搶走。

為了留住用戶,同時(shí)也為了抓住新的機(jī)會(huì),剪映布局AIGC幾乎是必然。

2023年11月,剪映測試名為“Dreamina”的AIGC工具,用戶只需輸入一段文字,Dreamina即可生成四幅由AI生成的創(chuàng)意圖像。這些圖像可以從抽象、寫實(shí)等多個(gè)維度生成,滿足不同用戶的審美需求。

彼時(shí),據(jù)Tech星球報(bào)道,消息人士透露,該工具未來會(huì)用于抖音的圖文或短視頻的內(nèi)容創(chuàng)作,豐富抖音在AI創(chuàng)造方面的內(nèi)容庫。

不過從效果來看,目前剪映面臨和Runway、Pika、Genmo等產(chǎn)品一樣的困境:視頻的運(yùn)動(dòng)不自然,保真度不高、視角單一等問題,這些問題本質(zhì)上是技術(shù)問題,Sora靠技術(shù)解決了這些問題,威脅到“剪映們”生存的同時(shí),也給“剪映們”提供了思路。

今年,原抖音集團(tuán)CEO張楠卸任,轉(zhuǎn)而投入剪映的發(fā)展,透露出抖音乃至字節(jié)對AI創(chuàng)作的重視。值得關(guān)注的是,在張楠發(fā)給剪映的內(nèi)部信中,張楠提到,AI圖像生成技術(shù)正在內(nèi)容創(chuàng)作工具行業(yè)帶來巨大的變化和可能性。

如今,Sora的橫空出世,給了字節(jié)跳動(dòng)壓力,它不能再慢了,而如何帶剪映突圍,則成了張楠新階段的重任。

2、張楠要為字節(jié)跳動(dòng)再次“開疆”

加入公司十年,原抖音集團(tuán)CEO張楠算得上是字節(jié)跳動(dòng)的功臣。某種程度上看,字節(jié)跳動(dòng)短視頻業(yè)務(wù)能夠快速“開疆?dāng)U土”,靠的就是張楠。

2015年開始,張楠先是帶著團(tuán)隊(duì)推出了火山小視頻,上線后迅速爆火,日活躍用戶很快突破5000萬;2016年,張楠從0到1推出了抖音,為當(dāng)下國內(nèi)最火的短視頻APP奠定了基礎(chǔ),如今抖音的日活超過了6.5億。

2020年3月12日,字節(jié)跳動(dòng)在成立八周年之際,宣布張楠擔(dān)任字節(jié)跳動(dòng)(中國)CEO,作為中國業(yè)務(wù)總負(fù)責(zé)人,全面協(xié)調(diào)公司中國業(yè)務(wù)的產(chǎn)品、運(yùn)營、市場和內(nèi)容合作,包括今日頭條、抖音、西瓜視頻、搜索等業(yè)務(wù)和產(chǎn)品。

張楠,圖源字節(jié)跳動(dòng)官網(wǎng)

沒過多久,伴隨字節(jié)組織架構(gòu)調(diào)整,抖音從字節(jié)跳動(dòng)旗下的APP成長為擁有復(fù)雜生態(tài)的抖音集團(tuán),旗下?lián)碛卸兑簟⒒鹕?、剪映、輕顏相機(jī)等多個(gè)APP,張楠出任抖音集團(tuán)CEO。

身份的變化,讓張楠更像是幕后掌控抖音全局的指揮官,而非沖鋒陷陣的將軍,但她始終是最了解抖音生態(tài)的人。

伴隨市場環(huán)境的變化,抖音短視頻的增長不及以前是事實(shí),但抖音要為字節(jié)尋找新增量的目標(biāo)沒變。AI的東風(fēng)越吹越大,原本是抖音視頻創(chuàng)作工具的剪映站在風(fēng)口之上,這是個(gè)機(jī)會(huì),字節(jié)跳動(dòng)必須抓住。

這時(shí)候,張楠的位置和角色很重要,最了解抖音的人,現(xiàn)在轉(zhuǎn)去負(fù)責(zé)剪映。

離開自己一手帶出來的抖音,張楠在告別文中表示,“在未來的十年再折騰一些我熱愛的事情”。

張楠職位的變化,與其說是她離開抖音權(quán)力中心,不如說是被放在了新的關(guān)鍵位置上,也釋放出字節(jié)要在AI領(lǐng)域突圍的信號。

就在張楠辭任抖音CEO一周前,字節(jié)CEO梁汝波在字節(jié)舉行的2024年度全員會(huì)上發(fā)表了“始終創(chuàng)業(yè),逃逸平庸的重力”的內(nèi)部講話。

在這場分享會(huì)上,梁汝波多次提及“危機(jī)感”一詞,梁汝波甚至還將“加強(qiáng)危機(jī)感”列入年度目標(biāo)。他坦言,最大的危機(jī)感,是擔(dān)心字節(jié)作為一個(gè)組織,正在變得平庸,無法取得新的突破。

字節(jié)跳動(dòng)CEO梁汝波,圖源字節(jié)范兒微信公眾號

當(dāng)短視頻業(yè)務(wù)趨近天花板,字節(jié)需要找到新的增長點(diǎn)。當(dāng)OpenAI的兩枚炸彈證明了AI行業(yè)蘊(yùn)藏的想象力,字節(jié)跳動(dòng)作為一家擁有豐富內(nèi)容生態(tài)的公司,擁有天然的AI使用場景,必須跟上AI的腳步,用AI技術(shù)為自身尋找突破。

“字節(jié)跳動(dòng)是最好的平臺(tái),既有夢想,又務(wù)實(shí)的浪漫,我很期待和剪映的小伙伴們一起造夢,與這個(gè)AI的時(shí)代一起成長,共同繪制出腦海中的奇幻世界?!睆堥绱藢懙馈?/p>

這個(gè)AI夢,不只屬于張楠自己,更肩負(fù)著字節(jié)跳動(dòng)的希望。

3、AI時(shí)代,字節(jié)跳動(dòng)的全球挑戰(zhàn)

如果一家創(chuàng)業(yè)公司2023年上半年?duì)I收超越騰訊,2024年開年估值達(dá)到2250億美元,位于全球獨(dú)角獸榜首,那這家公司的年度關(guān)鍵詞會(huì)是什么?

不是信心、不是振奮,字節(jié)跳動(dòng)CEO梁汝波給出的答案是危機(jī)感。

梁汝波提到,組織上,字節(jié)跳動(dòng)變得平庸:低效、遲鈍、標(biāo)準(zhǔn)低;人才管理上,去肥增瘦效果不明顯,對優(yōu)質(zhì)人才吸引力降低;業(yè)務(wù)上,核心業(yè)務(wù)領(lǐng)先不明顯,其他業(yè)務(wù)需要突破。

“對機(jī)會(huì)敏感度不如創(chuàng)業(yè)公司”,公司業(yè)務(wù)上遲鈍加重了梁汝波的危機(jī)感。對大模型的技術(shù)浪潮跟進(jìn)太慢,就是梁汝波感到危機(jī)的原因之一。

2023年,由OpenAI開啟了“ChatGPT熱”,也掀起了全球范圍內(nèi)的GPT競賽,國內(nèi)外多個(gè)知名互聯(lián)網(wǎng)巨頭都推出了自研大模型產(chǎn)品。

回看字節(jié)跳動(dòng)的動(dòng)作:2023年1月組建了首個(gè)大模型團(tuán)隊(duì),將遠(yuǎn)在新加坡負(fù)責(zé)TikTok技術(shù)負(fù)責(zé)人朱文佳調(diào)回國內(nèi)擔(dān)任團(tuán)隊(duì)的業(yè)務(wù)負(fù)責(zé)人;2023年5月,字節(jié)跳動(dòng)創(chuàng)始人張一鳴忙著研究OpenAI的一系列論文,并且常常讀至深夜。

只是,相比字節(jié)跳動(dòng)曾經(jīng)的戰(zhàn)斗力,在新的AI時(shí)代,字節(jié)跳動(dòng)似乎沒能一鳴驚人。

當(dāng)其他公司都在加入大模型競賽,一個(gè)接著一個(gè)產(chǎn)品陸續(xù)推出后,字節(jié)跳動(dòng)在2023年8月才推出自研大模型“云雀大模型”。在此之后,字節(jié)跳動(dòng)的AI動(dòng)作才變得快速而頻繁起來。

先是AI對話產(chǎn)品“豆包”開啟測試,它的前身是字節(jié)內(nèi)部代號為“Grace”的AI項(xiàng)目,可以生成歌詞、小說、文案等文本內(nèi)容,還可以提供數(shù)學(xué)計(jì)算、翻譯、英文寫作等功能;后有扣子、AI角色互動(dòng)APP“話爐”、AI產(chǎn)品“PicPic”等產(chǎn)品進(jìn)入內(nèi)測和研發(fā)階段。

目前,字節(jié)在國內(nèi)外已上線十余款A(yù)I產(chǎn)品,除了上述提到的產(chǎn)品,還有“AI搜”、 AI情緒伴聊機(jī)器人的“抖音小晴”、 針對電商內(nèi)容創(chuàng)作的產(chǎn)品“即創(chuàng)”、AI工具合集小悟空(ChitChop)、 AI 劇情互動(dòng)平臺(tái)BagelBell等。

這些產(chǎn)品的背后,是一個(gè)全新的AI部門Flow,也是字節(jié)在AI時(shí)代的排頭兵。據(jù)36氪報(bào)道,F(xiàn)low部門技術(shù)負(fù)責(zé)人為字節(jié)跳動(dòng)技術(shù)副總裁洪定坤。一位知情人士告訴36氪,這一新部門的業(yè)務(wù)帶頭人,為字節(jié)大模型團(tuán)隊(duì)的負(fù)責(zé)人朱文佳;據(jù)Tech星球報(bào)道,字節(jié)跳動(dòng)產(chǎn)品與戰(zhàn)略副總裁朱駿已負(fù)責(zé)Flow部門的產(chǎn)品線。

調(diào)用多名主力干將,字節(jié)發(fā)力AI的意圖已經(jīng)十分明顯。只是,雖然在AI的投入不少,但字節(jié)系產(chǎn)品要突圍并不容易。比如,“豆包”的推出不僅比ChatGPT晚了八個(gè)月,從效果上看,多家媒體評測結(jié)果顯示,“豆包”的智能化水平在大模型C端助理類產(chǎn)品中沒有明顯優(yōu)勢。

一個(gè)明顯的變化是,到了AI時(shí)代,字節(jié)跳動(dòng)還處在追隨者的角色,且尚未有彎道超車的跡象。

而放眼TikTok在全球的發(fā)展,要面對的挑戰(zhàn)和競爭也不少。在這種情況下,字節(jié)跳動(dòng)在AI時(shí)代還沒有自己的獨(dú)特優(yōu)勢,甚至有可能被新技術(shù)顛覆,這或許正是梁汝波的危機(jī)感所在。

“字節(jié)跳動(dòng)目前的業(yè)務(wù)有非常大的慣性,哪怕團(tuán)隊(duì)不額外努力,公司仍然可以依賴慣性滑行很長一段時(shí)間,但這是很危險(xiǎn)的?!?梁汝波提到。

在過去的十年,字節(jié)跳動(dòng)抓住了短視頻時(shí)代的紅利,而下一個(gè)十年,如何在AI時(shí)代,從追隨者變成創(chuàng)造者,保持創(chuàng)業(yè)狀態(tài)繼續(xù)突圍,考驗(yàn)著字節(jié)跳動(dòng)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

字節(jié)跳動(dòng)

4.4k
  • 國內(nèi)第一,火爆全球!字節(jié)豆包會(huì)是AI屆的王者嗎?
  • 字節(jié)跳動(dòng):市場出現(xiàn)炒作“豆包概念股”現(xiàn)象,投資者勿輕信市場傳言

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

Sora來了,字節(jié)發(fā)力:張楠的重任和挑戰(zhàn)

壓力給到了剪映。

文|連線Insight 王慧瑩

編輯|子夜

OpenAI再次引發(fā)全球注目。

北京時(shí)間2月16日,OpenAI發(fā)布了文生視頻大模型Sora。從官方介紹看,Sora能夠根據(jù)文本提示創(chuàng)建詳細(xì)的視頻,擴(kuò)展現(xiàn)有視頻中的敘述以及從靜態(tài)圖像生成場景,最長能生成60秒視頻。

這熟悉的一幕,讓人夢回2023年。彼時(shí),ChatGPT引發(fā)了大模型的浪潮,掀起了全球范圍內(nèi)的AI軍備競賽。到了今年,OpenAI再次扔出一枚石子,在文生視頻的池子里激起漣漪。

Sora讓“一句話生成視頻”變成可能,這是一場人工智能改變視頻制作的革命,全球短視頻巨頭字節(jié)跳動(dòng)也不能忽視這個(gè)浪潮。

巧合的是,Sora問世一周前,字節(jié)跳動(dòng)宣布了一項(xiàng)人事變動(dòng),原抖音集團(tuán)CEO張楠宣布,自己已經(jīng)辭去集團(tuán)CEO一職,未來把精力聚焦在剪映的發(fā)展上。字節(jié)跳動(dòng)CEO梁汝波表示,感謝張楠過去帶領(lǐng)中國信息平臺(tái)業(yè)務(wù)做出的貢獻(xiàn)和突破,期待她在新崗位上再接再厲。

作為元老級員工,張楠已經(jīng)加入字節(jié)跳動(dòng)十年整,主導(dǎo)推出了抖音、火山等產(chǎn)品。她帶領(lǐng)抖音完成了對競爭對手的反超,成為字節(jié)跳動(dòng)實(shí)現(xiàn)二次飛躍的關(guān)鍵人物。如今,抖音的日活已經(jīng)超過6.5億,成為全球范圍內(nèi)短視頻領(lǐng)域的佼佼者。

高層的變動(dòng)常常伴隨業(yè)務(wù)的調(diào)整,讓最熟悉抖音生態(tài)的人來負(fù)責(zé)剪映,字節(jié)跳動(dòng)的目標(biāo)很明確,要在AI文生視頻制作方面抓住新的爆發(fā)機(jī)遇。

據(jù)時(shí)代周報(bào)報(bào)道,接近剪映的人士透露,過去一年,張楠已經(jīng)把絕大多數(shù)精力傾斜到剪映先關(guān)的業(yè)務(wù)上,并親自帶隊(duì)尋求在AI輔助創(chuàng)作上有所突破,并即將推出一個(gè)AI生成和視頻的產(chǎn)品。

ChatGPT和Sora給字節(jié)跳動(dòng)帶來了新的啟發(fā),也帶來了更多壓力。過去一年,字節(jié)跳動(dòng)延續(xù)超級APP的邏輯,接連推出了多款基于AI技術(shù)的產(chǎn)品,分布對話、工具、互動(dòng)劇情等多個(gè)類別,包括豆包、扣子等APP。

動(dòng)作很多,但速度不快,成果不顯,這讓字節(jié)跳動(dòng)感到焦慮。年初內(nèi)部會(huì)議上,梁汝波把對技術(shù)部門的不滿表達(dá)得很直白。他說,字節(jié)跳動(dòng)居然直到2023年才開始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司都是在2018年至2021年創(chuàng)立的。

AI風(fēng)口下,字節(jié)還沒能大力出奇跡,張楠再次擔(dān)任了沖鋒者的角色。能否帶領(lǐng)剪映再次創(chuàng)造奇跡,對張楠和字節(jié)跳動(dòng)來說至關(guān)重要,這決定了字節(jié)跳動(dòng)能否走出增長困境,尋找到新的生機(jī)。

1、Sora來了,壓力給到了字節(jié)跳動(dòng)

一位時(shí)尚女性走在充滿溫暖霓虹燈和動(dòng)畫城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包;她戴著太陽鏡,涂著紅色口紅;她走路自信又隨意……

潮濕積水的街道倒映著上空的影像、女性皮膚上的毛孔清晰可見,如此逼真寫實(shí)的視頻畫面,出自AI之手。

Sora示例視頻,來源OpenAI官網(wǎng)

沒有任何預(yù)告,OpenAI再放大招。北京時(shí)間2月16日OpenAI在社交平臺(tái)X發(fā)帖,首次對外公布了名為Sora的文生視頻AI模型。

Sora帶來的震撼,不亞于去年的ChatGPT,瞬時(shí)成為開年最火爆的話題之一。

事實(shí)上,文生視頻并非新鮮事物。在Sora發(fā)布前,根據(jù)知名投資機(jī)構(gòu)a16z統(tǒng)計(jì),截至2024年底,市場上共有21個(gè)公開的AI視頻模型,包括大眾熟知的Runway、Pika、Genmo以及Stable Video Diffusion等等。

但Sora為何會(huì)如此驚艷,并以顛覆性再次攪動(dòng)AI行業(yè)?理解力、還原力是Sora效果超預(yù)期的核心。

OpenAI官網(wǎng)上的多段視頻也證明了Sora的能力。兩艘海盜船在一杯咖啡中航行,在泛白的咖啡泡沫中互相激斗;載滿乘客的列車駛過光影交替的城市,車窗上投射出生動(dòng)的車內(nèi)倒影;舞龍隊(duì)伍在周邊人群的圍觀和隨行中前進(jìn),遠(yuǎn)近透視真實(shí)感十足。

在視頻時(shí)長上看,用戶只需要輸入一段文本,Sora就能自動(dòng)生成最長一分鐘的高清視頻。這超出了市面上的大多數(shù)產(chǎn)品。根據(jù)a16z統(tǒng)計(jì),現(xiàn)有的AI視頻模型制作的視頻長度大都在10秒以內(nèi),像此前大熱的Runway Gen 2、Pika,其制作的視頻長度分別只有4秒和3秒。

更重要的是,Sora對真實(shí)世界的理解能力和還原能力都超出了市面現(xiàn)有的大模型。

正如OpenAI在官方博客上寫道,Sora不僅可以理解用戶的需求,還知道這些事物在現(xiàn)實(shí)世界如何存在。具體而言,Sora不僅能實(shí)現(xiàn)一鏡到底,還能完成多角度鏡頭、分鏡頭的切換,更能還原真實(shí)世界中的光影反射、人類行為等。

超預(yù)期的表現(xiàn)離不開技術(shù)支撐。據(jù)OpenAI介紹,因使用Transformer架構(gòu),Sora具有極強(qiáng)的擴(kuò)展性,同時(shí)在基于過去對DALL·E和GPT的研究基礎(chǔ)構(gòu)建上還利用了DALL·E 3的重述提示詞技術(shù),為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注。

Sora的出現(xiàn)能否掀起中國乃至全球范圍新一輪的AI軍備競賽尚不可知,但能生成60s視頻的Sora,把壓力實(shí)實(shí)在在給到了字節(jié)跳動(dòng)。因?yàn)?0s視頻所處的賽道,正是字節(jié)跳動(dòng)王牌業(yè)務(wù)抖音的大本營。

在抖音生態(tài)越來越豐富后,為了服務(wù)內(nèi)容創(chuàng)作者,剪映也應(yīng)運(yùn)而生。背靠抖音的流量池,截至2021年,剪映的月活用戶已經(jīng)突破1億,是國內(nèi)最大的移動(dòng)視頻編輯產(chǎn)品。而TikTok在全球的風(fēng)靡,也帶動(dòng)了剪映海外版CapCut的下載量激增。

剪映之所以能夠如此風(fēng)靡,原因在于降低了門檻,讓普通人都能夠更快更簡單地產(chǎn)出視頻內(nèi)容。

而近兩年,隨著AIGC的火爆,視頻制作門檻將被再次降低。這也是如今Sora對剪映產(chǎn)生威脅的核心原因:更多人將傾向于選擇門檻更低,但效果更好的平臺(tái),剪映的用戶將可能被AI視頻生成產(chǎn)品搶走。

為了留住用戶,同時(shí)也為了抓住新的機(jī)會(huì),剪映布局AIGC幾乎是必然。

2023年11月,剪映測試名為“Dreamina”的AIGC工具,用戶只需輸入一段文字,Dreamina即可生成四幅由AI生成的創(chuàng)意圖像。這些圖像可以從抽象、寫實(shí)等多個(gè)維度生成,滿足不同用戶的審美需求。

彼時(shí),據(jù)Tech星球報(bào)道,消息人士透露,該工具未來會(huì)用于抖音的圖文或短視頻的內(nèi)容創(chuàng)作,豐富抖音在AI創(chuàng)造方面的內(nèi)容庫。

不過從效果來看,目前剪映面臨和Runway、Pika、Genmo等產(chǎn)品一樣的困境:視頻的運(yùn)動(dòng)不自然,保真度不高、視角單一等問題,這些問題本質(zhì)上是技術(shù)問題,Sora靠技術(shù)解決了這些問題,威脅到“剪映們”生存的同時(shí),也給“剪映們”提供了思路。

今年,原抖音集團(tuán)CEO張楠卸任,轉(zhuǎn)而投入剪映的發(fā)展,透露出抖音乃至字節(jié)對AI創(chuàng)作的重視。值得關(guān)注的是,在張楠發(fā)給剪映的內(nèi)部信中,張楠提到,AI圖像生成技術(shù)正在內(nèi)容創(chuàng)作工具行業(yè)帶來巨大的變化和可能性。

如今,Sora的橫空出世,給了字節(jié)跳動(dòng)壓力,它不能再慢了,而如何帶剪映突圍,則成了張楠新階段的重任。

2、張楠要為字節(jié)跳動(dòng)再次“開疆”

加入公司十年,原抖音集團(tuán)CEO張楠算得上是字節(jié)跳動(dòng)的功臣。某種程度上看,字節(jié)跳動(dòng)短視頻業(yè)務(wù)能夠快速“開疆?dāng)U土”,靠的就是張楠。

2015年開始,張楠先是帶著團(tuán)隊(duì)推出了火山小視頻,上線后迅速爆火,日活躍用戶很快突破5000萬;2016年,張楠從0到1推出了抖音,為當(dāng)下國內(nèi)最火的短視頻APP奠定了基礎(chǔ),如今抖音的日活超過了6.5億。

2020年3月12日,字節(jié)跳動(dòng)在成立八周年之際,宣布張楠擔(dān)任字節(jié)跳動(dòng)(中國)CEO,作為中國業(yè)務(wù)總負(fù)責(zé)人,全面協(xié)調(diào)公司中國業(yè)務(wù)的產(chǎn)品、運(yùn)營、市場和內(nèi)容合作,包括今日頭條、抖音、西瓜視頻、搜索等業(yè)務(wù)和產(chǎn)品。

張楠,圖源字節(jié)跳動(dòng)官網(wǎng)

沒過多久,伴隨字節(jié)組織架構(gòu)調(diào)整,抖音從字節(jié)跳動(dòng)旗下的APP成長為擁有復(fù)雜生態(tài)的抖音集團(tuán),旗下?lián)碛卸兑?、火山、剪映、輕顏相機(jī)等多個(gè)APP,張楠出任抖音集團(tuán)CEO。

身份的變化,讓張楠更像是幕后掌控抖音全局的指揮官,而非沖鋒陷陣的將軍,但她始終是最了解抖音生態(tài)的人。

伴隨市場環(huán)境的變化,抖音短視頻的增長不及以前是事實(shí),但抖音要為字節(jié)尋找新增量的目標(biāo)沒變。AI的東風(fēng)越吹越大,原本是抖音視頻創(chuàng)作工具的剪映站在風(fēng)口之上,這是個(gè)機(jī)會(huì),字節(jié)跳動(dòng)必須抓住。

這時(shí)候,張楠的位置和角色很重要,最了解抖音的人,現(xiàn)在轉(zhuǎn)去負(fù)責(zé)剪映。

離開自己一手帶出來的抖音,張楠在告別文中表示,“在未來的十年再折騰一些我熱愛的事情”。

張楠職位的變化,與其說是她離開抖音權(quán)力中心,不如說是被放在了新的關(guān)鍵位置上,也釋放出字節(jié)要在AI領(lǐng)域突圍的信號。

就在張楠辭任抖音CEO一周前,字節(jié)CEO梁汝波在字節(jié)舉行的2024年度全員會(huì)上發(fā)表了“始終創(chuàng)業(yè),逃逸平庸的重力”的內(nèi)部講話。

在這場分享會(huì)上,梁汝波多次提及“危機(jī)感”一詞,梁汝波甚至還將“加強(qiáng)危機(jī)感”列入年度目標(biāo)。他坦言,最大的危機(jī)感,是擔(dān)心字節(jié)作為一個(gè)組織,正在變得平庸,無法取得新的突破。

字節(jié)跳動(dòng)CEO梁汝波,圖源字節(jié)范兒微信公眾號

當(dāng)短視頻業(yè)務(wù)趨近天花板,字節(jié)需要找到新的增長點(diǎn)。當(dāng)OpenAI的兩枚炸彈證明了AI行業(yè)蘊(yùn)藏的想象力,字節(jié)跳動(dòng)作為一家擁有豐富內(nèi)容生態(tài)的公司,擁有天然的AI使用場景,必須跟上AI的腳步,用AI技術(shù)為自身尋找突破。

“字節(jié)跳動(dòng)是最好的平臺(tái),既有夢想,又務(wù)實(shí)的浪漫,我很期待和剪映的小伙伴們一起造夢,與這個(gè)AI的時(shí)代一起成長,共同繪制出腦海中的奇幻世界?!睆堥绱藢懙?。

這個(gè)AI夢,不只屬于張楠自己,更肩負(fù)著字節(jié)跳動(dòng)的希望。

3、AI時(shí)代,字節(jié)跳動(dòng)的全球挑戰(zhàn)

如果一家創(chuàng)業(yè)公司2023年上半年?duì)I收超越騰訊,2024年開年估值達(dá)到2250億美元,位于全球獨(dú)角獸榜首,那這家公司的年度關(guān)鍵詞會(huì)是什么?

不是信心、不是振奮,字節(jié)跳動(dòng)CEO梁汝波給出的答案是危機(jī)感。

梁汝波提到,組織上,字節(jié)跳動(dòng)變得平庸:低效、遲鈍、標(biāo)準(zhǔn)低;人才管理上,去肥增瘦效果不明顯,對優(yōu)質(zhì)人才吸引力降低;業(yè)務(wù)上,核心業(yè)務(wù)領(lǐng)先不明顯,其他業(yè)務(wù)需要突破。

“對機(jī)會(huì)敏感度不如創(chuàng)業(yè)公司”,公司業(yè)務(wù)上遲鈍加重了梁汝波的危機(jī)感。對大模型的技術(shù)浪潮跟進(jìn)太慢,就是梁汝波感到危機(jī)的原因之一。

2023年,由OpenAI開啟了“ChatGPT熱”,也掀起了全球范圍內(nèi)的GPT競賽,國內(nèi)外多個(gè)知名互聯(lián)網(wǎng)巨頭都推出了自研大模型產(chǎn)品。

回看字節(jié)跳動(dòng)的動(dòng)作:2023年1月組建了首個(gè)大模型團(tuán)隊(duì),將遠(yuǎn)在新加坡負(fù)責(zé)TikTok技術(shù)負(fù)責(zé)人朱文佳調(diào)回國內(nèi)擔(dān)任團(tuán)隊(duì)的業(yè)務(wù)負(fù)責(zé)人;2023年5月,字節(jié)跳動(dòng)創(chuàng)始人張一鳴忙著研究OpenAI的一系列論文,并且常常讀至深夜。

只是,相比字節(jié)跳動(dòng)曾經(jīng)的戰(zhàn)斗力,在新的AI時(shí)代,字節(jié)跳動(dòng)似乎沒能一鳴驚人。

當(dāng)其他公司都在加入大模型競賽,一個(gè)接著一個(gè)產(chǎn)品陸續(xù)推出后,字節(jié)跳動(dòng)在2023年8月才推出自研大模型“云雀大模型”。在此之后,字節(jié)跳動(dòng)的AI動(dòng)作才變得快速而頻繁起來。

先是AI對話產(chǎn)品“豆包”開啟測試,它的前身是字節(jié)內(nèi)部代號為“Grace”的AI項(xiàng)目,可以生成歌詞、小說、文案等文本內(nèi)容,還可以提供數(shù)學(xué)計(jì)算、翻譯、英文寫作等功能;后有扣子、AI角色互動(dòng)APP“話爐”、AI產(chǎn)品“PicPic”等產(chǎn)品進(jìn)入內(nèi)測和研發(fā)階段。

目前,字節(jié)在國內(nèi)外已上線十余款A(yù)I產(chǎn)品,除了上述提到的產(chǎn)品,還有“AI搜”、 AI情緒伴聊機(jī)器人的“抖音小晴”、 針對電商內(nèi)容創(chuàng)作的產(chǎn)品“即創(chuàng)”、AI工具合集小悟空(ChitChop)、 AI 劇情互動(dòng)平臺(tái)BagelBell等。

這些產(chǎn)品的背后,是一個(gè)全新的AI部門Flow,也是字節(jié)在AI時(shí)代的排頭兵。據(jù)36氪報(bào)道,F(xiàn)low部門技術(shù)負(fù)責(zé)人為字節(jié)跳動(dòng)技術(shù)副總裁洪定坤。一位知情人士告訴36氪,這一新部門的業(yè)務(wù)帶頭人,為字節(jié)大模型團(tuán)隊(duì)的負(fù)責(zé)人朱文佳;據(jù)Tech星球報(bào)道,字節(jié)跳動(dòng)產(chǎn)品與戰(zhàn)略副總裁朱駿已負(fù)責(zé)Flow部門的產(chǎn)品線。

調(diào)用多名主力干將,字節(jié)發(fā)力AI的意圖已經(jīng)十分明顯。只是,雖然在AI的投入不少,但字節(jié)系產(chǎn)品要突圍并不容易。比如,“豆包”的推出不僅比ChatGPT晚了八個(gè)月,從效果上看,多家媒體評測結(jié)果顯示,“豆包”的智能化水平在大模型C端助理類產(chǎn)品中沒有明顯優(yōu)勢。

一個(gè)明顯的變化是,到了AI時(shí)代,字節(jié)跳動(dòng)還處在追隨者的角色,且尚未有彎道超車的跡象。

而放眼TikTok在全球的發(fā)展,要面對的挑戰(zhàn)和競爭也不少。在這種情況下,字節(jié)跳動(dòng)在AI時(shí)代還沒有自己的獨(dú)特優(yōu)勢,甚至有可能被新技術(shù)顛覆,這或許正是梁汝波的危機(jī)感所在。

“字節(jié)跳動(dòng)目前的業(yè)務(wù)有非常大的慣性,哪怕團(tuán)隊(duì)不額外努力,公司仍然可以依賴慣性滑行很長一段時(shí)間,但這是很危險(xiǎn)的。” 梁汝波提到。

在過去的十年,字節(jié)跳動(dòng)抓住了短視頻時(shí)代的紅利,而下一個(gè)十年,如何在AI時(shí)代,從追隨者變成創(chuàng)造者,保持創(chuàng)業(yè)狀態(tài)繼續(xù)突圍,考驗(yàn)著字節(jié)跳動(dòng)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。