正在閱讀:

對(duì)話宇樹王興興:做人形機(jī)器人要克制一點(diǎn),別變成傳統(tǒng)自動(dòng)化公司

掃一掃下載界面新聞APP

對(duì)話宇樹王興興:做人形機(jī)器人要克制一點(diǎn),別變成傳統(tǒng)自動(dòng)化公司

王興興認(rèn)為人形機(jī)器人離自己的“iPhone時(shí)刻”還遠(yuǎn),但對(duì)其商用未來(lái)持樂(lè)觀態(tài)度。

圖片來(lái)源:界面

界面新聞?dòng)浾?| 陸柯言

界面新聞編輯 | 宋佳楠

8月21日,2024世界機(jī)器人大會(huì)在北京亦莊拉開帷幕。無(wú)論是從參展商還是觀展人數(shù)來(lái)看,這都是歷年來(lái)熱度最高的一屆大會(huì)。這背后,與具身智能概念的爆火相關(guān)。

在眾多參展的機(jī)器人公司中,來(lái)自杭州的宇樹科技頗受關(guān)注。

今年5月,這家公司發(fā)布了人形機(jī)器人G1。它能夠完成站起、坐下折疊、舞棍等高難度動(dòng)作,也具備精準(zhǔn)操作物體的能力。更重要的是,G1的售價(jià)僅為9.9萬(wàn)元,這也是雙足機(jī)器人價(jià)格首次被打到10萬(wàn)元以內(nèi)。

而在近日,宇樹科技又發(fā)布了G1的量產(chǎn)版本,成為國(guó)內(nèi)少數(shù)幾家具備人形機(jī)器人量產(chǎn)能力的公司。宇樹科技創(chuàng)始人兼CEO王興興在接受界面新聞采訪時(shí)表示,G1的銷量基本符合預(yù)期,目前已在科研、教育、工廠等場(chǎng)景落地應(yīng)用。

他還解答了外界對(duì)宇樹科技和人形機(jī)器人的諸多疑問(wèn),包括降本方法、量產(chǎn)挑戰(zhàn)、商用進(jìn)展、技術(shù)限制,以及人形機(jī)器人距離iPhone時(shí)刻究竟還有多少年。

采訪中,“干活”和“通用AI”成為反復(fù)出現(xiàn)的高頻詞匯。王興興認(rèn)為,人形機(jī)器人當(dāng)下的能力還不足以實(shí)現(xiàn)真正的“干活”,但這應(yīng)是它最具價(jià)值的部分。由于人形機(jī)器人缺乏像ChatGPT那樣的通用模型,當(dāng)前行業(yè)面臨著極大阻礙。

“我一直有種感覺(jué),人形機(jī)器人公司還是要克制一點(diǎn),不要把自己做成傳統(tǒng)的自動(dòng)化公司?!彼f(shuō)。

王興興并不喜歡將今年定義為人形機(jī)器人的商用元年,認(rèn)為那還為時(shí)過(guò)早,畢竟頭部公司的年出貨量也不過(guò)百來(lái)臺(tái)。但他依然對(duì)人形機(jī)器人的商用未來(lái)持樂(lè)觀態(tài)度,“如果拿大語(yǔ)言模型來(lái)對(duì)比,今年就像是ChatGPT誕生的前兩年?!?/span>

在他看來(lái),盡管這一領(lǐng)域的技術(shù)路線還有許多模糊地帶,但當(dāng)更多聰明人和資本涌入,轉(zhuǎn)折點(diǎn)也將很快到來(lái)。

以下為訪談實(shí)錄(有不改變?cè)獾膭h減及編輯):

AI讓做機(jī)器人變簡(jiǎn)單

問(wèn):為什么G1可以做到9.9萬(wàn)的價(jià)格?宇樹是如何降本的?

王興興:價(jià)格更友好,產(chǎn)品才有更多人買,才能在全球范圍內(nèi)推動(dòng)行業(yè)進(jìn)步。

我們的價(jià)格相對(duì)比較低,因?yàn)槲覀冏?/span>四足機(jī)器人已經(jīng)很多年了,對(duì)于機(jī)械、成本、生產(chǎn)都有比較多的經(jīng)驗(yàn),而四足和人形機(jī)器人很多設(shè)計(jì)是類似的,這也是我們低價(jià)的基礎(chǔ)。宇樹的四足機(jī)器人最低賣到9000多元一臺(tái),對(duì)比機(jī)器人還有點(diǎn)貴。

要把所有的零部件,哪怕一個(gè)螺絲釘都設(shè)計(jì)到極致是非常耗時(shí)間的。公司到現(xiàn)在已經(jīng)成立了8年,有好幾款產(chǎn)品實(shí)現(xiàn)了量產(chǎn),但我們依然很有壓力,為每一個(gè)零部件都要精細(xì)設(shè)置,有些技術(shù)要求高的零部件都是以0.01毫米起步考慮的。

因?yàn)槟壳暗牧坎粔颍绻覀儍r(jià)格定得太低,對(duì)行業(yè)和公司都不好。我們還是希望價(jià)格相對(duì)合理,可能到明年后年出貨量會(huì)進(jìn)一步提升,機(jī)器人的能力也會(huì)越來(lái)越強(qiáng),價(jià)格可以做更好地調(diào)整。

問(wèn):宇樹是做四足機(jī)器人起家的。四足機(jī)器人和人形機(jī)器人的關(guān)系,像是人從爬行到站立起來(lái)的過(guò)程嗎?

王興興:從技術(shù)上或者進(jìn)化角度,你可以這么認(rèn)為,畢竟靈長(zhǎng)類動(dòng)物本身也是從4條腿進(jìn)化過(guò)來(lái)的機(jī)器人也是一樣,為什么早年大家做四足機(jī)器人更多,因?yàn)樗姆€(wěn)定性、負(fù)載、續(xù)航能力更強(qiáng),技術(shù)成熟度更高。

過(guò)去一兩年,國(guó)內(nèi)很多人形機(jī)器人公司都出來(lái)了。為什么他們做得很快?原因非常簡(jiǎn)單,他們用了大量開源的四足機(jī)器人技術(shù),包括算法硬件

問(wèn):對(duì)于設(shè)計(jì)風(fēng)格怎么想的?

王興興:我們希望產(chǎn)品盡量簡(jiǎn)潔,無(wú)論是外觀還是功能,都不要弄得太復(fù)雜,像iPhone一樣。交互的簡(jiǎn)潔性是對(duì)產(chǎn)品最極致,也是最重要的要求。

問(wèn):為何宇樹波士頓動(dòng)力的Atlas都采用了是三指設(shè)計(jì)?

王興興:目前全球人形機(jī)器人的方案不是特別統(tǒng)一,客戶的需求也不一樣,最典型的代表就是手。G1高度大概只有1.3米多,如果我們給他裝了五指,會(huì)發(fā)現(xiàn)這個(gè)手有點(diǎn)太大了,我覺(jué)得非常不好看。而三指手大部分產(chǎn)品都能用,抓東西都可以抓得很牢,包括波士頓動(dòng)力的Atlas在工廠里干活,三指就夠用了。出于實(shí)用性的角度,大家還是希望機(jī)器人的手勢(shì)越簡(jiǎn)單越好

目前來(lái)說(shuō),把物體從這里抓到那里,只要一個(gè)關(guān)節(jié)就夠用了,如果要做更精細(xì)的事情,比如說(shuō)拿電烙鐵去焊接,或拿筷子,三個(gè)手指也基本夠用。大家可以想象一下,如果自己只有兩三個(gè)手指,其實(shí)能干很多活。

AI的加入使得對(duì)件的自由度數(shù)量、外觀靈活度要求越來(lái)越低,這是一種趨勢(shì)。假使你隨便找?guī)讉€(gè)關(guān)節(jié)電機(jī)和木頭,把它拼在一起,搭出人形,都很可能讓它走起來(lái)或者干點(diǎn)活。

不急于商業(yè)化

問(wèn):宇樹和其他人形機(jī)器人公司最大的不同點(diǎn)是什么?

王興興:宇樹目前主要高性能機(jī)器人,未來(lái)希望做全球最領(lǐng)先的能給大家產(chǎn)生價(jià)值的機(jī)器人,無(wú)論是四足還是人形機(jī)器人,我們都愿意去做。形態(tài)是非常自由的一件事情。如果說(shuō)和別的公司不一樣,那就是我們發(fā)展時(shí)間更長(zhǎng),產(chǎn)品成熟度更好一些。

問(wèn):現(xiàn)在宇樹的商業(yè)化進(jìn)展是一個(gè)什么階段?人形機(jī)器人在哪些場(chǎng)景落地比較多?

王興興:我們很早就開始做商業(yè)化,2016年成立,2017年開始預(yù)售接訂單,2018年正式發(fā)布。人形機(jī)器人的客戶目前比較雜,有個(gè)人用戶、科研教育公司、AI公司、科技公司,還有一些工廠。

問(wèn):最近智元也有產(chǎn)品發(fā)布,他們看上去尤為在意商業(yè)化進(jìn)展,但宇樹似乎淡定一些?

王興興:我們確實(shí)不是特別急,還是希望能把產(chǎn)品做得更好之后再去推商業(yè)化,但也不排斥?,F(xiàn)在會(huì)有一些公司合作,但我們產(chǎn)品太多了,不可能把所有事情都宣傳得很到位,所以大家不太知道。

問(wèn):早期業(yè)界普遍不看好人形機(jī)器人,宇樹怎么看待外界的聲音?對(duì)于人形機(jī)器人的發(fā)展策略,宇樹是有自己明確的發(fā)展規(guī)劃,還是隨著社會(huì)共識(shí)變化而改變?

王興興:基本上還是遵循社會(huì)共識(shí)。雷總說(shuō)過(guò),順勢(shì)而為,做太早或太晚,都是非常不好的一件事。

以前有很多投資人問(wèn)我,你們做不做人形機(jī)器人?我斬釘截鐵地說(shuō),我不做。我在大一寒假就做過(guò)仿生機(jī)器人,但產(chǎn)品沒(méi)有達(dá)到我的預(yù)期。當(dāng)時(shí)全球的人形機(jī)器人都不是特別理想,性能上不去,也沒(méi)辦法到能干活的階段,所以我當(dāng)時(shí)就決定不做了。

但到2021、2022年,在馬斯克的帶領(lǐng)下,全球開始非常關(guān)注人形機(jī)器人,尤其是2022年底大模型誕生之后,AI技術(shù)產(chǎn)生了明顯的質(zhì)變,也開始有客戶找上我們。社會(huì)的共識(shí)足夠了,有人愿意買,我們才會(huì)做。

問(wèn):很多具身智能公司會(huì)把宇樹定位成機(jī)器人的“身體”,自己則是機(jī)器人的“大腦,認(rèn)可這樣的說(shuō)法嗎?軟硬件企業(yè)未來(lái)更多會(huì)走向競(jìng)爭(zhēng)還是合作?

王興興:非常歡迎客戶用我們的硬件,哪怕把我軟件全刪了,我們也非常歡迎,初衷還是希望更多人來(lái)用我們的機(jī)器人。

定位這個(gè)問(wèn)題,我們過(guò)去有跟一些AI公司合作,自己也會(huì)做一些AI,如果完全不做的話,大家不知道我們機(jī)器人AI效果怎么樣,總要有一個(gè)初始的軟件系統(tǒng)。但我們對(duì)AI的投資是比較克制的,因?yàn)樘珶X了。

機(jī)器人肯定是我們的立身之本,同時(shí)也歡迎和各種大模型公司合作,特別是愿意在我們的產(chǎn)品上標(biāo)配做得好的大模型,把我們的軟件替換成它的也可以。

問(wèn):資本進(jìn)入之后,會(huì)不會(huì)跟原有的研發(fā)團(tuán)隊(duì)產(chǎn)生路線上的分歧?是否會(huì)針對(duì)投資方美團(tuán)的業(yè)務(wù)推出一些特定機(jī)器人?

王興興:我們?nèi)谫Y和估值還是比較克制的,投資方對(duì)具體的公司管理不怎么參與。一件事情能做或是不做,他們不太會(huì)有大的意見(jiàn)。美團(tuán)確實(shí)我們最大的股東,后續(xù)也可能有合作的機(jī)會(huì)。

問(wèn):今年國(guó)內(nèi)很多機(jī)器人宣布進(jìn)廠打工,但大多不具備實(shí)際操縱的能力,怎么看?宇樹機(jī)器人針對(duì)工廠端的落地有哪些規(guī)劃?

王興興:的確是一個(gè)趨勢(shì),但目前還沒(méi)有形成商業(yè)閉環(huán),即產(chǎn)生的商業(yè)價(jià)值是正向的,要比人的成本更低。我們公司目前主要是賣本體的,并不是說(shuō)一定要做工業(yè)如果科研、教育公司買我們的產(chǎn)品,或者個(gè)人用戶買來(lái)玩,也完全歡迎。

工業(yè)領(lǐng)域也在推進(jìn),比如去做一些生產(chǎn)資料分配或者簡(jiǎn)單的搬運(yùn),推進(jìn)的速度沒(méi)那么快。我們對(duì)這個(gè)行業(yè)還是比較有耐心的,不會(huì)把自己逼那么緊更多還是尊重市場(chǎng)的反應(yīng)。等到技術(shù)和產(chǎn)品大家接觸到一定程度,有一些商業(yè)推廣的苗頭了,我們?cè)俅笠?guī)模推廣。

問(wèn):未來(lái)在研發(fā)上的迭代方向是怎樣的?

王興興:成本更加合理,性能和外觀做得更好,用戶體驗(yàn)才能更好,這是最主要的大方向。再者,要時(shí)刻了解全球的技術(shù)和產(chǎn)品導(dǎo)向,不能松懈,不能覺(jué)得今天已經(jīng)做得不錯(cuò)了,未來(lái)一兩年就不改進(jìn)了。

機(jī)器人離“iPhone時(shí)刻”還遠(yuǎn)

問(wèn):是否認(rèn)同“今年是人形機(jī)器人的商用元年”?

王興興:今年的體量其實(shí)很小,即使在商業(yè)化的情況下,有些公司最多也就小幾十臺(tái)這種級(jí)別。我個(gè)人不是很喜歡這個(gè)定義。

問(wèn):預(yù)計(jì)通用機(jī)器人領(lǐng)域何時(shí)會(huì)出現(xiàn)iPhone時(shí)刻”?AI化模型給機(jī)器人帶來(lái)了哪些明顯的能力提升,目前還存在哪些挑戰(zhàn)?

王興興:還是稍微有點(diǎn)遠(yuǎn)。iPhone的出現(xiàn)綜合性技術(shù)的突破,原來(lái)已經(jīng)有了觸摸屏、CPU、交互界面,然后喬布斯提出了終極產(chǎn)品構(gòu)想,把這些技術(shù)都整合在一起(才有了iPhone)。

可能現(xiàn)在大家還覺(jué)得機(jī)器人有點(diǎn)傻,就只能干一些固定的活,我覺(jué)得今年年底之前,至少全球有一家公司能把通用機(jī)器人的AI模型做出來(lái)。當(dāng)然,這個(gè)是接口,也不是iPhone時(shí)刻”。真正的iPhone時(shí)刻”,還是希望在工業(yè)或服務(wù)業(yè)終端產(chǎn)品的出現(xiàn),行業(yè)的出貨量暴增,可能還要三四年,但不會(huì)超過(guò)五年。

ChatGPT沒(méi)出來(lái)之前,大家覺(jué)得大語(yǔ)言模型的東西很散,什么都干不了,出來(lái)以后就不一樣了。我們做的很多機(jī)器人也是這樣,可能今天還在地上打滾,突然訓(xùn)練出一個(gè)模型,放上去之后就非常智能,所以我比較樂(lè)觀。

問(wèn):技術(shù)層面,人形機(jī)器人目前最大的挑戰(zhàn)在哪里?

王興興:最大的限制門檻還是AI方面不太夠,機(jī)器人AI的能力在全球范圍都沒(méi)有達(dá)到一個(gè)像初代ChatGPT那樣的水平。

模型、AI訓(xùn)練數(shù)據(jù)集、AI產(chǎn)品的落地部署、硬件層面都遠(yuǎn)遠(yuǎn)不夠,但這不是理論上的門檻。工程上就是要把成本做得更低,外觀做得更極致、功能更豐富,這是工程問(wèn)題,這部分時(shí)間是可以預(yù)估的。

如果今天有人把AI機(jī)器人的通用模型做出來(lái),找我們定制人形機(jī)器人,我可以保證年底之前就能完成,做10萬(wàn)個(gè)人形機(jī)器人都行。我加大產(chǎn)能和研發(fā)效率,投大量的人,甚至通宵都沒(méi)問(wèn)題,因?yàn)橛布旧聿皇菃?wèn)題,最大的問(wèn)題還是機(jī)器人的AI能力沒(méi)有足夠的突破。

當(dāng)然,硬件也要繼續(xù)完善,比如電池容量做更大,減速機(jī)的壽命可以做得更長(zhǎng),負(fù)載能力更好,靈巧操作的精度更高,視覺(jué)感知的分辨率更高,執(zhí)行速度更快,但這些都不是最大的限制。

問(wèn):現(xiàn)階段的大模型可以解決人形機(jī)器人哪些技術(shù)問(wèn)題?大模型和AI的應(yīng)用有望降低機(jī)器人的研發(fā)成本嗎?

王興興:目前大家說(shuō)大模型時(shí),多是指大語(yǔ)言模型或者多模態(tài)模型,這部分可以給機(jī)器人用,但不是全部。機(jī)器人要發(fā)展下去,單純的大語(yǔ)言模型是不夠的。

例如在工廠里做事的機(jī)器人,完全不用說(shuō)話,給他布置一個(gè)任務(wù),看一張照片,或者敲一個(gè)數(shù)字進(jìn)去,讓他干活就行了。無(wú)論是在工廠擰螺絲,還是在家洗衣做飯,機(jī)器人最主要的還是要能干活。對(duì)話的話,一部手機(jī)就可以做得很好。

對(duì)于干活這個(gè)點(diǎn)目前的大語(yǔ)言模型可以用到一部分,但更多是要做一個(gè)機(jī)器人的模型出來(lái),比如把圖像數(shù)據(jù)、關(guān)節(jié)指令數(shù)據(jù)、激光雷達(dá)或者別的數(shù)據(jù)加到里面。特斯拉最近就在招數(shù)據(jù)的采集工人,然后去做訓(xùn)練,待遇也不錯(cuò)這和大語(yǔ)言模型沒(méi)多大關(guān)系,更多是模仿學(xué)習(xí)。

目前整個(gè)體系不太成熟,包括機(jī)器人應(yīng)該在哪里裝相機(jī)、裝幾個(gè)、傳感器數(shù)據(jù)怎么采,要不要數(shù)據(jù)傳感器等問(wèn)題。國(guó)外有些流派,他連靈巧手都不想用,只想用個(gè)爪子,但有些就希望手指更加靈活,每個(gè)手指上有豐富的傳感器。每個(gè)人的想法都不太一樣,很難評(píng)價(jià)哪個(gè)路線是錯(cuò)誤的。

問(wèn):你之前提過(guò)會(huì)考慮在機(jī)器人上添加更多的觸覺(jué)感知,觸覺(jué)的重要性在哪兒?瓶頸是什么?

王興興:觸覺(jué)非常重要。假設(shè)一個(gè)人全身皮膚的觸覺(jué)都喪失了,影響會(huì)非常大,可能抓不住東西,走路也會(huì)跌倒。但目前的觸覺(jué)確實(shí)做得非常糟糕,很多機(jī)械臂基本上沒(méi)有觸覺(jué)。這個(gè)事情不好做,它要求靈敏度,意味著要部署成百上千個(gè)觸點(diǎn)或者觸覺(jué)傳感器,萬(wàn)一磕碰,損壞的概率是非常大的,這也是做觸覺(jué)最大的瓶頸和量產(chǎn)的挑戰(zhàn)。如果一臺(tái)機(jī)器人全身有1000個(gè)觸點(diǎn),那量產(chǎn)一定要保證做得非常好,想想都是令人崩潰的事情。

問(wèn):物理交互可以加深模仿和強(qiáng)化學(xué)習(xí),但這項(xiàng)技術(shù)現(xiàn)在還不成熟,之后可以如何改進(jìn)?

王興興:我一直覺(jué)得物理交互非常重要,要真正讓機(jī)器人去生活中幫忙處理事情,如果只用虛擬的數(shù)據(jù)去訓(xùn)練遠(yuǎn)遠(yuǎn)不夠的。虛擬數(shù)據(jù)最多達(dá)到一種程度,即大概知道要干什么,比如往前走,或者把什么東西放在一起,但要組裝精密零部件這類工作,誤差會(huì)比較大,沒(méi)辦法完全契合地進(jìn)行實(shí)物操作還是要非常有必要去做一些實(shí)物訓(xùn)練,把最后的閉環(huán)跑通。

問(wèn):你多次提到機(jī)器人最重要的就是干活,有沒(méi)有什么具體的期待?

王興興:干活也分好幾個(gè)階段,當(dāng)下的AI可以做一些模仿學(xué)習(xí)的措施,如果是固定工位,比如說(shuō)把一個(gè)電池從這里拿到那里,全球很多公司都能做,成功率基本上接近100%。

更進(jìn)一步的話,還是希望它能在工廠里做更復(fù)雜一點(diǎn)的事情。比如拆裝零部件,或者做一些農(nóng)業(yè)相關(guān)的工作,就不是簡(jiǎn)單的抓取,這件事明后年基本就可以做了。

終極階段,希望真的非常通用,比如隨便給一個(gè)人形機(jī)器看一張照片或者說(shuō)一下,它就可以組裝產(chǎn)品或者整理桌子,即使它完全沒(méi)見(jiàn)過(guò)桌子原本長(zhǎng)什么樣。

最主要的還是AI軟件去發(fā)力。AI軟件沒(méi)有突破,硬件做得再好也不行。我一直有個(gè)感覺(jué),現(xiàn)在人形機(jī)器人需要克制一下,不要把自己做著做著變成一家傳統(tǒng)自動(dòng)化公司。你要跟自動(dòng)化行業(yè)卷效率是永遠(yuǎn)卷不過(guò)的,還是要把AI軟件做好之后,去做一些更有價(jià)值的事情。

問(wèn):機(jī)器人行業(yè)借助AI熱度重新火起來(lái)后,產(chǎn)業(yè)端和銷售端相較于過(guò)去有哪些明顯的不同?

王興興:變化非常大。與過(guò)去幾十年比,最近一兩年新的AI和機(jī)器人浪潮完全是兩個(gè)世界,技術(shù)的認(rèn)可度和資本的熱度都不一樣,全球的大公司、中小企業(yè)、地方政府都非常關(guān)注機(jī)器人。但由于它還只能做一些固定的事情,大家不太滿意,整個(gè)行業(yè)發(fā)展跟通用AI落后了差不多10年的。我覺(jué)得會(huì)慢慢趕上來(lái),因?yàn)?/span>有更多的聰明人、更多的資本和關(guān)注進(jìn)來(lái)了。

問(wèn):現(xiàn)在機(jī)器人都還在投入期,預(yù)計(jì)何時(shí)能到盈虧平衡?

王興興:具體要看怎么算。我們還是保留了合理的利潤(rùn),希望有更多的機(jī)器人出貨量,這是最重要的。

如果投入大量的AI與人力,可能很難實(shí)現(xiàn)盈虧平衡,因?yàn)锳I太燒錢了。我們對(duì)AI的投入相對(duì)克制一些。

問(wèn):大模型領(lǐng)域很信仰堆算力,人形機(jī)器人能否靠投入大量的數(shù)據(jù)和算力把通用模型搞得更好?

王興興:如果對(duì)大公司或者底子比較厚的公司,有財(cái)力和人力,可以多投入一點(diǎn),但我們還是要算賬。

其實(shí)國(guó)內(nèi)大公司對(duì)AI的投入也是比較克制的,團(tuán)隊(duì)大一點(diǎn)的可能有小幾百人,少一點(diǎn)不過(guò)幾十個(gè)人。目前機(jī)器人的通用AI模型技術(shù)路線沒(méi)那么清晰,如果投入過(guò)多的財(cái)力和人力,會(huì)有使不上勁的感覺(jué)。

OpenAI當(dāng)時(shí)投入大,他們內(nèi)部已經(jīng)驗(yàn)證了模型是OK的,再加算力和資源效果愈發(fā)明顯,那就得加大投入。而在機(jī)器人領(lǐng)域,現(xiàn)在很難說(shuō)哪個(gè)方向特別正確。特斯拉要搞的模仿學(xué)習(xí)可能堆數(shù)據(jù)是有效果,但更大的驗(yàn)證不太確定。

問(wèn):如何看待當(dāng)下機(jī)器人行業(yè)的競(jìng)爭(zhēng)格局?中小公司的機(jī)會(huì)在哪里?

王興興:中小公司競(jìng)爭(zhēng)也是我一直在考慮的問(wèn)題。最重要的是得保持對(duì)前沿技術(shù)的敏感度,得看到未來(lái),足夠靈活如果能預(yù)估未來(lái)一兩甚至五年以后的技術(shù)路線和行業(yè)格局,提前布局,肯定死不了。

這方面大公司反倒有點(diǎn)難,因?yàn)閮?nèi)部流程復(fù)雜、團(tuán)隊(duì)間競(jìng)爭(zhēng),資源溝通的順暢性比較低),甚至有時(shí)大公司招人都沒(méi)有小公司方便。

問(wèn):中國(guó)、日本和美國(guó)人形機(jī)器人領(lǐng)域算是比較快的,你覺(jué)得中國(guó)企業(yè)擁有哪些優(yōu)勢(shì)?

王興興:每個(gè)國(guó)家都有自己特點(diǎn),而且做都還不錯(cuò)。中國(guó)的優(yōu)勢(shì)可能在于工業(yè)底子比較厚,劣勢(shì)就是AI人才非常缺乏,整個(gè)教育體系對(duì)AI人才的培養(yǎng)還是不太夠。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

對(duì)話宇樹王興興:做人形機(jī)器人要克制一點(diǎn),別變成傳統(tǒng)自動(dòng)化公司

王興興認(rèn)為人形機(jī)器人離自己的“iPhone時(shí)刻”還遠(yuǎn),但對(duì)其商用未來(lái)持樂(lè)觀態(tài)度。

圖片來(lái)源:界面

界面新聞?dòng)浾?| 陸柯言

界面新聞編輯 | 宋佳楠

8月21日,2024世界機(jī)器人大會(huì)在北京亦莊拉開帷幕。無(wú)論是從參展商還是觀展人數(shù)來(lái)看,這都是歷年來(lái)熱度最高的一屆大會(huì)。這背后,與具身智能概念的爆火相關(guān)。

在眾多參展的機(jī)器人公司中,來(lái)自杭州的宇樹科技頗受關(guān)注。

今年5月,這家公司發(fā)布了人形機(jī)器人G1。它能夠完成站起、坐下折疊、舞棍等高難度動(dòng)作,也具備精準(zhǔn)操作物體的能力。更重要的是,G1的售價(jià)僅為9.9萬(wàn)元,這也是雙足機(jī)器人價(jià)格首次被打到10萬(wàn)元以內(nèi)。

而在近日,宇樹科技又發(fā)布了G1的量產(chǎn)版本,成為國(guó)內(nèi)少數(shù)幾家具備人形機(jī)器人量產(chǎn)能力的公司。宇樹科技創(chuàng)始人兼CEO王興興在接受界面新聞采訪時(shí)表示,G1的銷量基本符合預(yù)期,目前已在科研、教育、工廠等場(chǎng)景落地應(yīng)用。

他還解答了外界對(duì)宇樹科技和人形機(jī)器人的諸多疑問(wèn),包括降本方法、量產(chǎn)挑戰(zhàn)、商用進(jìn)展、技術(shù)限制,以及人形機(jī)器人距離iPhone時(shí)刻究竟還有多少年。

采訪中,“干活”和“通用AI”成為反復(fù)出現(xiàn)的高頻詞匯。王興興認(rèn)為,人形機(jī)器人當(dāng)下的能力還不足以實(shí)現(xiàn)真正的“干活”,但這應(yīng)是它最具價(jià)值的部分。由于人形機(jī)器人缺乏像ChatGPT那樣的通用模型,當(dāng)前行業(yè)面臨著極大阻礙。

“我一直有種感覺(jué),人形機(jī)器人公司還是要克制一點(diǎn),不要把自己做成傳統(tǒng)的自動(dòng)化公司?!彼f(shuō)。

王興興并不喜歡將今年定義為人形機(jī)器人的商用元年,認(rèn)為那還為時(shí)過(guò)早,畢竟頭部公司的年出貨量也不過(guò)百來(lái)臺(tái)。但他依然對(duì)人形機(jī)器人的商用未來(lái)持樂(lè)觀態(tài)度,“如果拿大語(yǔ)言模型來(lái)對(duì)比,今年就像是ChatGPT誕生的前兩年?!?/span>

在他看來(lái),盡管這一領(lǐng)域的技術(shù)路線還有許多模糊地帶,但當(dāng)更多聰明人和資本涌入,轉(zhuǎn)折點(diǎn)也將很快到來(lái)。

以下為訪談實(shí)錄(有不改變?cè)獾膭h減及編輯):

AI讓做機(jī)器人變簡(jiǎn)單

問(wèn):為什么G1可以做到9.9萬(wàn)的價(jià)格?宇樹是如何降本的?

王興興:價(jià)格更友好,產(chǎn)品才有更多人買,才能在全球范圍內(nèi)推動(dòng)行業(yè)進(jìn)步。

我們的價(jià)格相對(duì)比較低,因?yàn)槲覀冏?/span>四足機(jī)器人已經(jīng)很多年了,對(duì)于機(jī)械、成本、生產(chǎn)都有比較多的經(jīng)驗(yàn),而四足和人形機(jī)器人很多設(shè)計(jì)是類似的,這也是我們低價(jià)的基礎(chǔ)。宇樹的四足機(jī)器人最低賣到9000多元一臺(tái),對(duì)比機(jī)器人還有點(diǎn)貴。

要把所有的零部件,哪怕一個(gè)螺絲釘都設(shè)計(jì)到極致是非常耗時(shí)間的。公司到現(xiàn)在已經(jīng)成立了8年,有好幾款產(chǎn)品實(shí)現(xiàn)了量產(chǎn),但我們依然很有壓力,為每一個(gè)零部件都要精細(xì)設(shè)置,有些技術(shù)要求高的零部件都是以0.01毫米起步考慮的。

因?yàn)槟壳暗牧坎粔?,如果我們價(jià)格定得太低,對(duì)行業(yè)和公司都不好。我們還是希望價(jià)格相對(duì)合理,可能到明年后年出貨量會(huì)進(jìn)一步提升,機(jī)器人的能力也會(huì)越來(lái)越強(qiáng),價(jià)格可以做更好地調(diào)整

問(wèn):宇樹是做四足機(jī)器人起家的。四足機(jī)器人和人形機(jī)器人的關(guān)系,像是人從爬行到站立起來(lái)的過(guò)程嗎?

王興興:從技術(shù)上或者進(jìn)化角度,你可以這么認(rèn)為,畢竟靈長(zhǎng)類動(dòng)物本身也是從4條腿進(jìn)化過(guò)來(lái)的。機(jī)器人也是一樣,為什么早年大家做四足機(jī)器人更多,因?yàn)樗姆€(wěn)定性、負(fù)載、續(xù)航能力更強(qiáng),技術(shù)成熟度更高。

過(guò)去一兩年,國(guó)內(nèi)很多人形機(jī)器人公司都出來(lái)了。為什么他們做得很快?原因非常簡(jiǎn)單,他們用了大量開源的四足機(jī)器人技術(shù),包括算法硬件。

問(wèn):對(duì)于設(shè)計(jì)風(fēng)格怎么想的?

王興興:我們希望產(chǎn)品盡量簡(jiǎn)潔,無(wú)論是外觀還是功能,都不要弄得太復(fù)雜,像iPhone一樣。交互的簡(jiǎn)潔性是對(duì)產(chǎn)品最極致,也是最重要的要求

問(wèn):為何宇樹波士頓動(dòng)力的Atlas都采用了是三指設(shè)計(jì)?

王興興:目前全球人形機(jī)器人的方案不是特別統(tǒng)一,客戶的需求也不一樣,最典型的代表就是手。G1高度大概只有1.3米多,如果我們給他裝了五指,會(huì)發(fā)現(xiàn)這個(gè)手有點(diǎn)太大了,我覺(jué)得非常不好看。而三指手大部分產(chǎn)品都能用,抓東西都可以抓得很牢,包括波士頓動(dòng)力的Atlas在工廠里干活,三指就夠用了。出于實(shí)用性的角度,大家還是希望機(jī)器人的手勢(shì)越簡(jiǎn)單越好。

目前來(lái)說(shuō),把物體從這里抓到那里,只要一個(gè)關(guān)節(jié)就夠用了,如果要做更精細(xì)的事情,比如說(shuō)拿電烙鐵去焊接,或拿筷子,三個(gè)手指也基本夠用大家可以想象一下,如果自己只有兩三個(gè)手指其實(shí)能干很多活。

AI的加入使得對(duì)件的自由度數(shù)量、外觀靈活度要求越來(lái)越低,這是一種趨勢(shì)。假使你隨便找?guī)讉€(gè)關(guān)節(jié)電機(jī)和木頭,把它拼在一起,搭出人形,都很可能讓它走起來(lái)或者干點(diǎn)活。

不急于商業(yè)化

問(wèn):宇樹和其他人形機(jī)器人公司最大的不同點(diǎn)是什么?

王興興:宇樹目前主要高性能機(jī)器人,未來(lái)希望做全球最領(lǐng)先的、能給大家產(chǎn)生價(jià)值的機(jī)器人,無(wú)論是四足還是人形機(jī)器人,我們都愿意去做。形態(tài)是非常自由的一件事情。如果說(shuō)和別的公司不一樣,那就是我們發(fā)展時(shí)間更長(zhǎng),產(chǎn)品成熟度更好一些。

問(wèn):現(xiàn)在宇樹的商業(yè)化進(jìn)展是一個(gè)什么階段?人形機(jī)器人在哪些場(chǎng)景落地比較多?

王興興:我們很早就開始做商業(yè)化,2016年成立,2017年開始預(yù)售接訂單,2018年正式發(fā)布。人形機(jī)器人的客戶目前比較雜,有個(gè)人用戶、科研教育公司、AI公司、科技公司,還有一些工廠。

問(wèn):最近智元也有產(chǎn)品發(fā)布,他們看上去尤為在意商業(yè)化進(jìn)展,但宇樹似乎淡定一些?

王興興:我們確實(shí)不是特別急,還是希望能把產(chǎn)品做得更好之后再去推商業(yè)化,但也不排斥?,F(xiàn)在會(huì)有一些公司合作,但我們產(chǎn)品太多了,不可能把所有事情都宣傳得很到位,所以大家不太知道。

問(wèn):早期業(yè)界普遍不看好人形機(jī)器人,宇樹怎么看待外界的聲音?對(duì)于人形機(jī)器人的發(fā)展策略,宇樹是有自己明確的發(fā)展規(guī)劃,還是隨著社會(huì)共識(shí)變化而改變?

王興興:基本上還是遵循社會(huì)共識(shí)。雷總說(shuō)過(guò),順勢(shì)而為,做太早或太晚,都是非常不好的一件事。

以前有很多投資人問(wèn)我,你們做不做人形機(jī)器人?我斬釘截鐵地說(shuō),我不做。我在大一寒假就做過(guò)仿生機(jī)器人,但產(chǎn)品沒(méi)有達(dá)到我的預(yù)期。當(dāng)時(shí)全球的人形機(jī)器人都不是特別理想,性能上不去,也沒(méi)辦法到能干活的階段,所以我當(dāng)時(shí)就決定不做了。

但到2021、2022年,在馬斯克的帶領(lǐng)下,全球開始非常關(guān)注人形機(jī)器人,尤其是2022年底大模型誕生之后,AI技術(shù)產(chǎn)生了明顯的質(zhì)變,也開始有客戶找上我們。社會(huì)的共識(shí)足夠了,有人愿意買,我們才會(huì)做。

問(wèn):很多具身智能公司會(huì)把宇樹定位成機(jī)器人的“身體”,自己則是機(jī)器人的“大腦,認(rèn)可這樣的說(shuō)法嗎?軟硬件企業(yè)未來(lái)更多會(huì)走向競(jìng)爭(zhēng)還是合作?

王興興:非常歡迎客戶用我們的硬件,哪怕把我軟件全刪了,我們也非常歡迎初衷還是希望更多人來(lái)用我們的機(jī)器人。

定位這個(gè)問(wèn)題,我們過(guò)去有跟一些AI公司合作,自己也會(huì)做一些AI,如果完全不做的話,大家不知道我們機(jī)器人AI效果怎么樣,總要有一個(gè)初始的軟件系統(tǒng)。但我們對(duì)AI的投資是比較克制的,因?yàn)樘珶X了。

機(jī)器人肯定是我們的立身之本,同時(shí)也歡迎和各種大模型公司合作,特別是愿意在我們的產(chǎn)品上標(biāo)配做得好的大模型,把我們的軟件替換成它的也可以。

問(wèn):資本進(jìn)入之后,會(huì)不會(huì)跟原有的研發(fā)團(tuán)隊(duì)產(chǎn)生路線上的分歧?是否會(huì)針對(duì)投資方美團(tuán)的業(yè)務(wù)推出一些特定機(jī)器人?

王興興:我們?nèi)谫Y和估值還是比較克制的,投資方對(duì)具體的公司管理不怎么參與。一件事情能做或是不做,他們不太會(huì)有大的意見(jiàn)。美團(tuán)確實(shí)我們最大的股東,后續(xù)也可能有合作的機(jī)會(huì)。

問(wèn):今年國(guó)內(nèi)很多機(jī)器人宣布進(jìn)廠打工,但大多不具備實(shí)際操縱的能力,怎么看?宇樹機(jī)器人針對(duì)工廠端的落地有哪些規(guī)劃?

王興興:的確是一個(gè)趨勢(shì),但目前還沒(méi)有形成商業(yè)閉環(huán),即產(chǎn)生的商業(yè)價(jià)值是正向的,要比人的成本更低。我們公司目前主要是賣本體的,并不是說(shuō)一定要做工業(yè),如果科研、教育公司買我們的產(chǎn)品,或者個(gè)人用戶買來(lái)玩,也完全歡迎

工業(yè)領(lǐng)域也在推進(jìn),比如去做一些生產(chǎn)資料分配或者簡(jiǎn)單的搬運(yùn),推進(jìn)的速度沒(méi)那么快我們對(duì)這個(gè)行業(yè)還是比較有耐心的,不會(huì)把自己逼那么緊更多還是尊重市場(chǎng)的反應(yīng)。等到技術(shù)和產(chǎn)品大家接觸到一定程度,有一些商業(yè)推廣的苗頭了,我們?cè)俅笠?guī)模推廣。

問(wèn):未來(lái)在研發(fā)上的迭代方向是怎樣的?

王興興:成本更加合理,性能和外觀做得更好,用戶體驗(yàn)才能更好,這是最主要的大方向。再者,要時(shí)刻了解全球的技術(shù)和產(chǎn)品導(dǎo)向,不能松懈,不能覺(jué)得今天已經(jīng)做得不錯(cuò)了,未來(lái)一兩年就不改進(jìn)了。

機(jī)器人離“iPhone時(shí)刻”還遠(yuǎn)

問(wèn):是否認(rèn)同“今年是人形機(jī)器人的商用元年”?

王興興:今年的體量其實(shí)很小,即使在商業(yè)化的情況下,有些公司最多也就小幾十臺(tái)這種級(jí)別。我個(gè)人不是很喜歡這個(gè)定義。

問(wèn):預(yù)計(jì)通用機(jī)器人領(lǐng)域何時(shí)會(huì)出現(xiàn)iPhone時(shí)刻”?AI化模型給機(jī)器人帶來(lái)了哪些明顯的能力提升,目前還存在哪些挑戰(zhàn)?

王興興:還是稍微有點(diǎn)遠(yuǎn)。iPhone的出現(xiàn)綜合性技術(shù)的突破,原來(lái)已經(jīng)有了觸摸屏、CPU、交互界面,然后喬布斯提出了終極產(chǎn)品構(gòu)想,把這些技術(shù)都整合在一起(才有了iPhone)。

可能現(xiàn)在大家還覺(jué)得機(jī)器人有點(diǎn)傻,就只能干一些固定的活,我覺(jué)得今年年底之前,至少全球有一家公司能把通用機(jī)器人的AI模型做出來(lái)。當(dāng)然,這個(gè)是接口,也不是iPhone時(shí)刻”。真正的iPhone時(shí)刻”,還是希望在工業(yè)或服務(wù)業(yè)終端產(chǎn)品的出現(xiàn),行業(yè)的出貨量暴增,可能還要三四年,但不會(huì)超過(guò)五年。

ChatGPT沒(méi)出來(lái)之前,大家覺(jué)得大語(yǔ)言模型的東西很散,什么都干不了,出來(lái)以后就不一樣了。我們做的很多機(jī)器人也是這樣,可能今天還在地上打滾,突然訓(xùn)練出一個(gè)模型,放上去之后就非常智能,所以我比較樂(lè)觀。

問(wèn):技術(shù)層面,人形機(jī)器人目前最大的挑戰(zhàn)在哪里?

王興興:最大的限制門檻還是AI方面不太夠,機(jī)器人AI的能力在全球范圍都沒(méi)有達(dá)到一個(gè)像初代ChatGPT那樣的水平。

模型、AI訓(xùn)練數(shù)據(jù)集、AI產(chǎn)品的落地部署、硬件層面都遠(yuǎn)遠(yuǎn)不夠,但這不是理論上的門檻。工程上就是要把成本做得更低,外觀做得更極致、功能更豐富,這是工程問(wèn)題,這部分時(shí)間是可以預(yù)估的。

如果今天有人把AI機(jī)器人的通用模型做出來(lái),找我們定制人形機(jī)器人,我可以保證年底之前就能完成,做10萬(wàn)個(gè)人形機(jī)器人都行。我加大產(chǎn)能和研發(fā)效率,投大量的人,甚至通宵都沒(méi)問(wèn)題,因?yàn)橛布旧聿皇菃?wèn)題,最大的問(wèn)題還是機(jī)器人的AI能力沒(méi)有足夠的突破。

當(dāng)然,硬件也要繼續(xù)完善,比如電池容量做更大,減速機(jī)的壽命可以做得更長(zhǎng),負(fù)載能力更好,靈巧操作的精度更高,視覺(jué)感知的分辨率更高,執(zhí)行速度更快,但這些都不是最大的限制。

問(wèn):現(xiàn)階段的大模型可以解決人形機(jī)器人哪些技術(shù)問(wèn)題?大模型和AI的應(yīng)用有望降低機(jī)器人的研發(fā)成本嗎?

王興興:目前大家說(shuō)大模型時(shí),多是指大語(yǔ)言模型或者多模態(tài)模型,這部分可以給機(jī)器人用,但不是全部。機(jī)器人要發(fā)展下去,單純的大語(yǔ)言模型是不夠的

例如在工廠里做事的機(jī)器人,完全不用說(shuō)話,給他布置一個(gè)任務(wù),看一張照片,或者敲一個(gè)數(shù)字進(jìn)去,讓他干活就行了。無(wú)論是在工廠擰螺絲,還是在家洗衣做飯,機(jī)器人最主要的還是要能干活。對(duì)話的話,一部手機(jī)就可以做得很好。

對(duì)于干活這個(gè)點(diǎn),目前的大語(yǔ)言模型可以用到一部分,但更多是要做一個(gè)機(jī)器人的模型出來(lái),比如把圖像數(shù)據(jù)、關(guān)節(jié)指令數(shù)據(jù)激光雷達(dá)或者別的數(shù)據(jù)加到里面。特斯拉最近就在招數(shù)據(jù)的采集工人,然后去做訓(xùn)練,待遇也不錯(cuò)。這和大語(yǔ)言模型沒(méi)多大關(guān)系,更多是模仿學(xué)習(xí)。

目前整個(gè)體系不太成熟,包括機(jī)器人應(yīng)該在哪里裝相機(jī)、裝幾個(gè)、傳感器數(shù)據(jù)怎么采,要不要數(shù)據(jù)傳感器等問(wèn)題。國(guó)外有些流派,他連靈巧手都不想用,只想用個(gè)爪子,但有些就希望手指更加靈活,每個(gè)手指上有豐富的傳感器。每個(gè)人的想法都不太一樣,很難評(píng)價(jià)哪個(gè)路線是錯(cuò)誤的

問(wèn):你之前提過(guò)會(huì)考慮在機(jī)器人上添加更多的觸覺(jué)感知,觸覺(jué)的重要性在哪兒?瓶頸是什么?

王興興:觸覺(jué)非常重要。假設(shè)一個(gè)人全身皮膚的觸覺(jué)都喪失了,影響會(huì)非常大,可能抓不住東西,走路也會(huì)跌倒。但目前的觸覺(jué)確實(shí)做得非常糟糕,很多機(jī)械臂基本上沒(méi)有觸覺(jué)。這個(gè)事情不好做,它要求靈敏度,意味著要部署成百上千個(gè)觸點(diǎn)或者觸覺(jué)傳感器,萬(wàn)一磕碰,損壞的概率是非常大的,這也是做觸覺(jué)最大的瓶頸和量產(chǎn)的挑戰(zhàn)。如果一臺(tái)機(jī)器人全身有1000個(gè)觸點(diǎn),那量產(chǎn)一定要保證做得非常好,想想都是令人崩潰的事情。

問(wèn):物理交互可以加深模仿和強(qiáng)化學(xué)習(xí),但這項(xiàng)技術(shù)現(xiàn)在還不成熟,之后可以如何改進(jìn)?

王興興:我一直覺(jué)得物理交互非常重要,要真正讓機(jī)器人去生活中幫忙處理事情,如果只用虛擬的數(shù)據(jù)去訓(xùn)練遠(yuǎn)遠(yuǎn)不夠的。虛擬數(shù)據(jù)最多達(dá)到一種程度,即大概知道要干什么,比如往前走,或者把什么東西放在一起,但要組裝精密零部件這類工作,誤差會(huì)比較大,沒(méi)辦法完全契合地進(jìn)行實(shí)物操作還是要非常有必要去做一些實(shí)物訓(xùn)練,把最后的閉環(huán)跑通。

問(wèn):你多次提到機(jī)器人最重要的就是干活,有沒(méi)有什么具體的期待?

王興興:干活也分好幾個(gè)階段,當(dāng)下的AI可以做一些模仿學(xué)習(xí)的措施,如果是固定工位,比如說(shuō)把一個(gè)電池從這里拿到那里,全球很多公司都能做,成功率基本上接近100%。

更進(jìn)一步的話,還是希望它能在工廠里做更復(fù)雜一點(diǎn)的事情。比如拆裝零部件,或者做一些農(nóng)業(yè)相關(guān)的工作,就不是簡(jiǎn)單的抓取,這件事明后年基本就可以做了。

終極階段,希望真的非常通用,比如隨便給一個(gè)人形機(jī)器看一張照片或者說(shuō)一下,它就可以組裝產(chǎn)品或者整理桌子,即使它完全沒(méi)見(jiàn)過(guò)桌子原本長(zhǎng)什么樣

最主要的還是AI軟件去發(fā)力。AI軟件沒(méi)有突破,硬件做得再好也不行。我一直有個(gè)感覺(jué),現(xiàn)在人形機(jī)器人需要克制一下,不要把自己做著做著變成一家傳統(tǒng)自動(dòng)化公司。你要跟自動(dòng)化行業(yè)卷效率是永遠(yuǎn)卷不過(guò)的,還是要把AI軟件做好之后,去做一些更有價(jià)值的事情。

問(wèn):機(jī)器人行業(yè)借助AI熱度重新火起來(lái)后,產(chǎn)業(yè)端和銷售端相較于過(guò)去有哪些明顯的不同?

王興興:變化非常大。與過(guò)去幾十年比,最近一兩年新的AI和機(jī)器人浪潮完全是兩個(gè)世界,技術(shù)的認(rèn)可度和資本的熱度都不一樣,全球的大公司、中小企業(yè)、地方政府都非常關(guān)注機(jī)器人。但由于它還只能做一些固定的事情,大家不太滿意,整個(gè)行業(yè)發(fā)展跟通用AI落后了差不多10年的。我覺(jué)得會(huì)慢慢趕上來(lái),因?yàn)?/span>有更多的聰明人、更多的資本和關(guān)注進(jìn)來(lái)了。

問(wèn):現(xiàn)在機(jī)器人都還在投入期,預(yù)計(jì)何時(shí)能到盈虧平衡?

王興興:具體要看怎么算。我們還是保留了合理的利潤(rùn),希望有更多的機(jī)器人出貨量,這是最重要的。

如果投入大量的AI與人力,可能很難實(shí)現(xiàn)盈虧平衡,因?yàn)锳I太燒錢了。我們對(duì)AI的投入相對(duì)克制一些。

問(wèn):大模型領(lǐng)域很信仰堆算力,人形機(jī)器人能否靠投入大量的數(shù)據(jù)和算力把通用模型搞得更好?

王興興:如果對(duì)大公司或者底子比較厚的公司,有財(cái)力和人力,可以多投入一點(diǎn),但我們還是要算賬

其實(shí)國(guó)內(nèi)大公司對(duì)AI的投入也是比較克制的,團(tuán)隊(duì)大一點(diǎn)的可能有小幾百人,少一點(diǎn)不過(guò)幾十個(gè)人。目前機(jī)器人的通用AI模型技術(shù)路線沒(méi)那么清晰,如果投入過(guò)多的財(cái)力和人力,會(huì)有使不上勁的感覺(jué)。

OpenAI當(dāng)時(shí)投入大,他們內(nèi)部已經(jīng)驗(yàn)證了模型是OK的,再加算力和資源效果愈發(fā)明顯,那就得加大投入。而在機(jī)器人領(lǐng)域,現(xiàn)在很難說(shuō)哪個(gè)方向特別正確。特斯拉要搞的模仿學(xué)習(xí)可能堆數(shù)據(jù)是有效果,但更大的驗(yàn)證不太確定。

問(wèn):如何看待當(dāng)下機(jī)器人行業(yè)的競(jìng)爭(zhēng)格局?中小公司的機(jī)會(huì)在哪里?

王興興:中小公司競(jìng)爭(zhēng)也是我一直在考慮的問(wèn)題。最重要的是得保持對(duì)前沿技術(shù)的敏感度,得看到未來(lái),足夠靈活。如果能預(yù)估未來(lái)一兩甚至五年以后的技術(shù)路線和行業(yè)格局,提前布局,肯定死不了

這方面大公司反倒有點(diǎn)難,因?yàn)閮?nèi)部流程復(fù)雜、團(tuán)隊(duì)間競(jìng)爭(zhēng),資源溝通的順暢性比較低),甚至有時(shí)大公司招人都沒(méi)有小公司方便

問(wèn):中國(guó)、日本和美國(guó)人形機(jī)器人領(lǐng)域算是比較快的,你覺(jué)得中國(guó)企業(yè)擁有哪些優(yōu)勢(shì)?

王興興:每個(gè)國(guó)家都有自己特點(diǎn),而且做都還不錯(cuò)。中國(guó)的優(yōu)勢(shì)可能在于工業(yè)底子比較厚,劣勢(shì)就是AI人才非常缺乏,整個(gè)教育體系對(duì)AI人才的培養(yǎng)還是不太夠。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。