正在閱讀:

人形機(jī)器人,距離“轉(zhuǎn)正上崗”還差幾步?

掃一掃下載界面新聞APP

人形機(jī)器人,距離“轉(zhuǎn)正上崗”還差幾步?

人形機(jī)器人還需通過(guò)“實(shí)習(xí)期”。

圖片來(lái)源:界面圖庫(kù)

文 | 趣解商業(yè) 劉亮

想象一下這個(gè)畫(huà)面:一個(gè)凌晨的車(chē)間,幾排整齊的人形機(jī)器人沙沙作響地做著流水線任務(wù)。這個(gè)場(chǎng)景放在幾年前只出現(xiàn)在科幻電影里,不過(guò)在今天已經(jīng)實(shí)現(xiàn)了。

前不久,人形機(jī)器人企業(yè)Figure推出第二代人形機(jī)器人Figure02,在軟硬件上比起一代都有突破進(jìn)展,更是搭載了“金主爸爸”O(jiān)penAI定制的語(yǔ)音推理模型,實(shí)現(xiàn)自然語(yǔ)言的交互。現(xiàn)在的它,已經(jīng)進(jìn)入寶馬車(chē)廠開(kāi)始“打工”了,可以無(wú)休止地狂干20個(gè)小時(shí)。

“炸裂”新品的發(fā)布又把人形機(jī)器人推到了輿論中心,從去年底優(yōu)必選(9880.HK)上市到今年WAIC上特斯拉Optimus新一代的亮相,再到近期Figure02的推出,人形機(jī)器人的發(fā)展在這兩年可謂進(jìn)展神速。

但是,脫下“創(chuàng)新技術(shù)”這層外殼,人形機(jī)器人的量產(chǎn)難度到底在哪里?從研發(fā)到商業(yè)化應(yīng)用又需要面對(duì)什么挑戰(zhàn)呢?

01 為什么是“人形”

人形機(jī)器人,最近又火了。

被微軟、英偉達(dá)和OpenAI投資的人形機(jī)器人企業(yè)Figure在前幾天發(fā)布了號(hào)稱(chēng)“地表最強(qiáng)”新款人形機(jī)器人Figure02。據(jù)“趣解商業(yè)”了解,和上一代相比,F(xiàn)igure02進(jìn)行了外觀的重構(gòu),機(jī)器人的外皮承擔(dān)了壓力,采用了外骨骼結(jié)構(gòu),這樣子機(jī)器人的電源和算力布線就集成在機(jī)體內(nèi)部,由此提高了機(jī)器人的性能;迭代后的Figure02手部具有16個(gè)自由度,能夠承受與人類(lèi)相當(dāng)?shù)牧α俊?/p>

軟件方面,新一代機(jī)器人也搭載了投資人OpenAI定制的語(yǔ)音到語(yǔ)音推理模型,這樣子人類(lèi)就可以直接用語(yǔ)音和機(jī)器人交互。

其實(shí)機(jī)器人發(fā)展到現(xiàn)在,在我們?nèi)粘I钪械臐B透率已經(jīng)非常高了,比如在商場(chǎng)里常見(jiàn)的大型清掃機(jī)器人、物流流水線上的物流機(jī)器人等;專(zhuān)項(xiàng)機(jī)器人如此完善的今天,我們?yōu)槭裁催€要做人形機(jī)器人?

而且,為什么一定要是“人形”?

答案其實(shí)很簡(jiǎn)單,因?yàn)橹挥小叭诵螜C(jī)器人”才最有可能接近“全能機(jī)器人”。

我們生活的世界中,所有的場(chǎng)景、設(shè)備、工具都是服務(wù)于人類(lèi)的形態(tài)設(shè)計(jì)的,所以各種單項(xiàng)的機(jī)器人可以拆解某一種具體的場(chǎng)景去使用,比如物流機(jī)器人可以做扛、放重物,工業(yè)機(jī)器人可以擰螺絲、掃地機(jī)器人可以打掃,但是出了這個(gè)特定的領(lǐng)域,這個(gè)機(jī)器人就成了一塊“高科技板磚”。

而只有人形機(jī)器人能夠不受場(chǎng)景的限制,融入人類(lèi)生活的各個(gè)方面。人形機(jī)器人最大的特點(diǎn)是自由度高,具備較強(qiáng)的自主性和多功能性;例如,在工業(yè)制造中,人形機(jī)器人可以替代人類(lèi)從事重復(fù)、繁雜和危險(xiǎn)的工作減少事故發(fā)生。我們可以將現(xiàn)在各種機(jī)器人理解成發(fā)展人形機(jī)器人的一個(gè)初級(jí)形態(tài),而人形機(jī)器人才是終極形態(tài)。

為了實(shí)現(xiàn)這個(gè)終極形態(tài),人形機(jī)器人需要做三件事:感知、運(yùn)動(dòng)、思考。

就拿跨越障礙物這件事情來(lái)說(shuō),得先“感知”到障礙物,然后“思考”是走過(guò)去、跳過(guò)去還是跨過(guò)去,最后“運(yùn)動(dòng)”或者說(shuō)行動(dòng)來(lái)實(shí)現(xiàn)跨越。這對(duì)普通人來(lái)說(shuō)只是下意識(shí)的行為,對(duì)人形機(jī)器人就是一個(gè)復(fù)雜的訓(xùn)練過(guò)程。

現(xiàn)在大部分的人形機(jī)器人的問(wèn)題都出在“思考”這個(gè)環(huán)節(jié)上,畢竟感知和運(yùn)動(dòng)可以通過(guò)傳感器布局、機(jī)器人關(guān)節(jié)設(shè)計(jì)的完善來(lái)在硬件上下功夫,不過(guò)“思考”這件事情實(shí)在是太復(fù)雜了。

以往大家的訓(xùn)練方式都是“打標(biāo)簽”,比如教人工智能學(xué)習(xí)什么叫做“西瓜”就把各式各樣的西瓜打上標(biāo)簽,人工智能在看到符合這個(gè)標(biāo)簽的物體的時(shí)候就可以給出相應(yīng)的認(rèn)知。不過(guò)這樣的訓(xùn)練方式放在有局限性的領(lǐng)域中還好,放在更大的領(lǐng)域中就很難做到窮盡。

現(xiàn)在有了大模型,就打開(kāi)了一種新的訓(xùn)練思路。大模型加上傳感器數(shù)據(jù),可以訓(xùn)練機(jī)器人更好地了解世界的規(guī)律。

比如同樣都是去冰箱里拿飲料,拿瓶裝可樂(lè)和袋裝牛奶的方式就不一樣,大模型學(xué)習(xí)可以讓機(jī)器人“理解”可樂(lè)可以直接捏起來(lái)而袋裝牛奶就要輕輕拎起來(lái)的區(qū)別。

更重要的是,大模型可以訓(xùn)練機(jī)器人對(duì)自然語(yǔ)言的理解,比如你說(shuō)“我餓了”,現(xiàn)在的機(jī)器人未必懂它需要做什么,但大模型訓(xùn)練之后,機(jī)器人就可以為你跳轉(zhuǎn)到外賣(mài)平臺(tái)的界面,更甚者可以給你去炒盤(pán)菜。對(duì)自然語(yǔ)言的深入理解,幫助機(jī)器人更好地理解人類(lèi),也能更大地減輕人類(lèi)與機(jī)器人的交互難度。

可以說(shuō),大模型的應(yīng)用又給人形機(jī)器人的發(fā)展推向了next level。

02 多方入局

在大模型的加持下,2023年被稱(chēng)為“人形機(jī)器人元年”。

從融資表現(xiàn)來(lái)看,據(jù)“IT桔子”數(shù)據(jù),2023年人形機(jī)器人領(lǐng)域融資事件有23起,總金額達(dá)到54.71億元,是過(guò)去十年以來(lái)的巔峰。而截至當(dāng)前,2024年人形機(jī)器人領(lǐng)域已經(jīng)有14起融資事件,總金額接近24億元。

圖源:IT桔子

從產(chǎn)品來(lái)看,2023年開(kāi)始至今,不論是新銳的產(chǎn)品還是企業(yè)都在涌現(xiàn)。比如2023年成立的星動(dòng)紀(jì)元,由清華大學(xué)交叉信息研究院孵化,致力于具身智能以及人形通用機(jī)器人技術(shù)和產(chǎn)品的研發(fā);同年成立的開(kāi)普勒,自研算法實(shí)現(xiàn)人形機(jī)器人預(yù)設(shè)動(dòng)作與端到端全自主規(guī)劃相結(jié)合模式及精準(zhǔn)控制...

還有趕在今年元旦之前上市的機(jī)器人賽道老牌選手優(yōu)必選,更是以“人形機(jī)器人第一股”的姿態(tài)給整個(gè)產(chǎn)業(yè)的資本化再次推上快車(chē)道。

以?xún)?yōu)必選為例,這些三方供應(yīng)商是整個(gè)領(lǐng)域的主力軍。這些企業(yè)基本都會(huì)以某種使用場(chǎng)景為切入來(lái)進(jìn)行人形機(jī)器人的研發(fā),比如優(yōu)必選更專(zhuān)注于工業(yè)制造、達(dá)闥更多面向家庭服務(wù)。作為整個(gè)產(chǎn)業(yè)鏈的中游,三方供應(yīng)商最重要的自然是爭(zhēng)取下游的訂單,趁早“進(jìn)廠”;所以,市場(chǎng)化、商業(yè)化就對(duì)他們非常重要。比如,今年2月,優(yōu)必選的Walker S已經(jīng)在合肥蔚來(lái)汽車(chē)工廠進(jìn)行“實(shí)調(diào)”;據(jù)“趣解商業(yè)”了解,優(yōu)必選已經(jīng)和數(shù)十家國(guó)內(nèi)頭部新能源汽車(chē)企業(yè)接觸,推進(jìn)人形機(jī)器人需求對(duì)接。

而這些“被進(jìn)廠”的下游企業(yè)當(dāng)中,也有部分開(kāi)始自己搞人形機(jī)器人的選手。

特斯拉,就是一個(gè)代表。機(jī)器人作為馬斯克的“宏圖計(jì)劃”當(dāng)中非常濃墨重彩的一筆,其機(jī)器人的代表作Optimus也一直都有進(jìn)展,如今已經(jīng)可以雙臂與腿配合完成基礎(chǔ)瑜伽動(dòng)作,與此同時(shí)保持軀干的穩(wěn)定性;還可以通過(guò)純視覺(jué)輸入,以正常的速度拿起積木,并能按照藍(lán)、綠兩類(lèi)顏色正確分類(lèi),在對(duì)面發(fā)生人為移動(dòng)積木的動(dòng)作時(shí),Optimus依舊能以自身原本的節(jié)奏順利完成任務(wù),且在積木擺放出錯(cuò)時(shí),自主調(diào)整正面朝上,完成糾錯(cuò)。

小米也早在2022年就發(fā)布了“Cyber one”,近期又聯(lián)手機(jī)器人泰斗王田苗,投資了一家名為"小雨智造"的具身智能科技公司,這也是小米首次對(duì)外投資具身智能領(lǐng)域公司;而本田入局機(jī)器人領(lǐng)域都已經(jīng)三十多年的時(shí)間,推出的ASIMO甚至在2002年就跑去和紐交所董事長(zhǎng)握手去了。

和中游供應(yīng)商有差別的是,下游企業(yè)的研發(fā)出了實(shí)用性還有品牌效應(yīng),尤其是這幾位都是現(xiàn)在典型的造車(chē)企業(yè),在汽車(chē)智能化勢(shì)不可擋的趨勢(shì)下,對(duì)于智能機(jī)器人的研究能讓車(chē)企更敏銳地捕捉前沿技術(shù),也展現(xiàn)自己的技術(shù)實(shí)力。

在去年的 1024 小鵬汽車(chē)科技日上,小鵬汽車(chē)董事長(zhǎng)兼CEO何小鵬推出了小鵬汽車(chē)自研的人形態(tài)雙足機(jī)器人 PX5;據(jù)“趣解商業(yè)”了解,小鵬團(tuán)隊(duì)耗時(shí) 5 個(gè)月,實(shí)現(xiàn)了自研雙足機(jī)器人的穩(wěn)定行走。

8月12日,何小鵬在微博上發(fā)布一則視頻,展示了一只機(jī)器手訂購(gòu)MONA M03的過(guò)程。何小鵬還表示:“AI及大型硬件的新進(jìn)展今年內(nèi)我們將跟大家同步,敬請(qǐng)期待。”雖然微博透露的信息不多,但也能看出小鵬在積極布局機(jī)器人賽道。

在實(shí)用性上,中游廠商更重視“開(kāi)源”,因?yàn)橐伴_(kāi)張賣(mài)錢(qián)”,而下游廠家就更重視“節(jié)流”。馬斯克就表示Optimus量產(chǎn)之后也會(huì)率先進(jìn)入到特斯拉的生產(chǎn)流水線。用人形機(jī)器人代替工人擰螺絲,可以收獲一個(gè)24小時(shí)待機(jī)、不會(huì)疲勞、不會(huì)鬧情緒的“完美打工人”,成本降低、效率提升,最終實(shí)現(xiàn)的就是生產(chǎn)成本的控制。

當(dāng)然,下游廠商研發(fā)的人形機(jī)器人足夠穩(wěn)定后也可以進(jìn)行商業(yè)化,從而成為整個(gè)企業(yè)收入的一個(gè)增長(zhǎng)部分;不過(guò)從底層邏輯來(lái)說(shuō),雖然都是爭(zhēng)先“進(jìn)廠”,但中游和下游的側(cè)重點(diǎn)還是略微不同。

03 何時(shí)量產(chǎn)

不論是中游還是下游選手,雖然都熱熱鬧鬧的,但也各有各的麻煩。

特斯拉的人形機(jī)器人已經(jīng)開(kāi)始拖延量產(chǎn)時(shí)間了。去年就表示Optimus要在2024年底前實(shí)現(xiàn)量產(chǎn)的馬斯克在不久前發(fā)推稱(chēng)特斯拉明年會(huì)小批量的生產(chǎn)人形機(jī)器人,然后預(yù)期在2026年實(shí)現(xiàn)量產(chǎn)以及對(duì)其他企業(yè)客戶(hù)的交付;也就是說(shuō)整個(gè)機(jī)器人的進(jìn)展推后了幾乎一年。

小米的“Cyber One”在2022年亮相之后最后一次展示是在2023世界機(jī)器人大會(huì)上,而且展示的也是2022年的老版本,之后也沒(méi)傳來(lái)什么突破性的消息。

那么,人形機(jī)器人的困境到底在哪里?

首先是技術(shù)難關(guān)。有媒體曾經(jīng)報(bào)道,國(guó)內(nèi)一線研發(fā)專(zhuān)家在人形機(jī)器人系列電話會(huì)上提出了人形機(jī)器人量產(chǎn)的四個(gè)技術(shù)痛點(diǎn):

1.手部和腿部硬件集成難度大,需要更高的損失峰值功率和驅(qū)動(dòng)能力;

2.腿部行走算法穩(wěn)定性難以保證,學(xué)術(shù)界尚未出現(xiàn)真正意義上的類(lèi)人走行算法;

3.手部精細(xì)化感知難度大,涉及到手的21-26個(gè)自由度;

4.雙臂協(xié)同、混合智能操控和避讓等算法難度大,需要高維度的規(guī)劃。

其次是在成本層面。機(jī)器人的量產(chǎn)還得考慮軟硬件的成本控制,如何隨規(guī)模效應(yīng)逐漸均攤成本。

但這邊成本控制都還不成熟,那邊市場(chǎng)定價(jià)就已經(jīng)卷起來(lái)了。今年5月,宇樹(shù)科技發(fā)布的G1人形機(jī)器人售價(jià)只要9.9萬(wàn)元,用得著和用不著機(jī)器人的都沉默了,因?yàn)槿诵螜C(jī)器人的定價(jià)當(dāng)時(shí)還動(dòng)輒在百萬(wàn)元的區(qū)間。結(jié)果大家還沒(méi)為9.9萬(wàn)元這個(gè)定價(jià)吃驚多久,3.65萬(wàn)元售價(jià)的眾擎機(jī)器人發(fā)布的專(zhuān)業(yè)級(jí)雙足機(jī)器人SA01整機(jī)或散件套裝上市,主要面向科研教育市場(chǎng)發(fā)售。

這種兩極分化的情況就讓很多機(jī)器人廠商十分為難了,而這背后反應(yīng)的實(shí)際是人形機(jī)器人下游市場(chǎng)需求不明確的情況。這也是大部分高新技術(shù)產(chǎn)品市場(chǎng)化的問(wèn)題,由于高新技術(shù)產(chǎn)品對(duì)技術(shù)創(chuàng)新有極高要求,結(jié)果滿(mǎn)足要求的產(chǎn)品又太貴,所以中游廠家只能推出一個(gè)又一個(gè)便宜的版本。

還有就是,人形機(jī)器人在非結(jié)構(gòu)化場(chǎng)景中的應(yīng)用受限;由于機(jī)器人通用性不足,無(wú)法靈活應(yīng)對(duì)突發(fā)事件。人形機(jī)器人的商業(yè)化落地,最需要的是一個(gè)迫切又確切的場(chǎng)景;以現(xiàn)在的局面來(lái)看,高端制造需求下的工業(yè)化場(chǎng)景,以及人口老齡化趨勢(shì)下的生活化場(chǎng)景是商業(yè)化價(jià)值最高的場(chǎng)景。但是市場(chǎng)上仍缺少一個(gè)產(chǎn)品的典范,讓大家能更直觀地看到人形機(jī)器人的商業(yè)價(jià)值。

人形機(jī)器人能否真正取代人類(lèi)的部分重復(fù)勞作,還有很長(zhǎng)一段路要走;但人形機(jī)器人必然是未來(lái)的趨勢(shì),誰(shuí)能把這個(gè)“故事”具象化,誰(shuí)才是贏家。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

人形機(jī)器人,距離“轉(zhuǎn)正上崗”還差幾步?

人形機(jī)器人還需通過(guò)“實(shí)習(xí)期”。

圖片來(lái)源:界面圖庫(kù)

文 | 趣解商業(yè) 劉亮

想象一下這個(gè)畫(huà)面:一個(gè)凌晨的車(chē)間,幾排整齊的人形機(jī)器人沙沙作響地做著流水線任務(wù)。這個(gè)場(chǎng)景放在幾年前只出現(xiàn)在科幻電影里,不過(guò)在今天已經(jīng)實(shí)現(xiàn)了。

前不久,人形機(jī)器人企業(yè)Figure推出第二代人形機(jī)器人Figure02,在軟硬件上比起一代都有突破進(jìn)展,更是搭載了“金主爸爸”O(jiān)penAI定制的語(yǔ)音推理模型,實(shí)現(xiàn)自然語(yǔ)言的交互。現(xiàn)在的它,已經(jīng)進(jìn)入寶馬車(chē)廠開(kāi)始“打工”了,可以無(wú)休止地狂干20個(gè)小時(shí)。

“炸裂”新品的發(fā)布又把人形機(jī)器人推到了輿論中心,從去年底優(yōu)必選(9880.HK)上市到今年WAIC上特斯拉Optimus新一代的亮相,再到近期Figure02的推出,人形機(jī)器人的發(fā)展在這兩年可謂進(jìn)展神速。

但是,脫下“創(chuàng)新技術(shù)”這層外殼,人形機(jī)器人的量產(chǎn)難度到底在哪里?從研發(fā)到商業(yè)化應(yīng)用又需要面對(duì)什么挑戰(zhàn)呢?

01 為什么是“人形”

人形機(jī)器人,最近又火了。

被微軟、英偉達(dá)和OpenAI投資的人形機(jī)器人企業(yè)Figure在前幾天發(fā)布了號(hào)稱(chēng)“地表最強(qiáng)”新款人形機(jī)器人Figure02。據(jù)“趣解商業(yè)”了解,和上一代相比,F(xiàn)igure02進(jìn)行了外觀的重構(gòu),機(jī)器人的外皮承擔(dān)了壓力,采用了外骨骼結(jié)構(gòu),這樣子機(jī)器人的電源和算力布線就集成在機(jī)體內(nèi)部,由此提高了機(jī)器人的性能;迭代后的Figure02手部具有16個(gè)自由度,能夠承受與人類(lèi)相當(dāng)?shù)牧α俊?/p>

軟件方面,新一代機(jī)器人也搭載了投資人OpenAI定制的語(yǔ)音到語(yǔ)音推理模型,這樣子人類(lèi)就可以直接用語(yǔ)音和機(jī)器人交互。

其實(shí)機(jī)器人發(fā)展到現(xiàn)在,在我們?nèi)粘I钪械臐B透率已經(jīng)非常高了,比如在商場(chǎng)里常見(jiàn)的大型清掃機(jī)器人、物流流水線上的物流機(jī)器人等;專(zhuān)項(xiàng)機(jī)器人如此完善的今天,我們?yōu)槭裁催€要做人形機(jī)器人?

而且,為什么一定要是“人形”?

答案其實(shí)很簡(jiǎn)單,因?yàn)橹挥小叭诵螜C(jī)器人”才最有可能接近“全能機(jī)器人”。

我們生活的世界中,所有的場(chǎng)景、設(shè)備、工具都是服務(wù)于人類(lèi)的形態(tài)設(shè)計(jì)的,所以各種單項(xiàng)的機(jī)器人可以拆解某一種具體的場(chǎng)景去使用,比如物流機(jī)器人可以做扛、放重物,工業(yè)機(jī)器人可以擰螺絲、掃地機(jī)器人可以打掃,但是出了這個(gè)特定的領(lǐng)域,這個(gè)機(jī)器人就成了一塊“高科技板磚”。

而只有人形機(jī)器人能夠不受場(chǎng)景的限制,融入人類(lèi)生活的各個(gè)方面。人形機(jī)器人最大的特點(diǎn)是自由度高,具備較強(qiáng)的自主性和多功能性;例如,在工業(yè)制造中,人形機(jī)器人可以替代人類(lèi)從事重復(fù)、繁雜和危險(xiǎn)的工作減少事故發(fā)生。我們可以將現(xiàn)在各種機(jī)器人理解成發(fā)展人形機(jī)器人的一個(gè)初級(jí)形態(tài),而人形機(jī)器人才是終極形態(tài)。

為了實(shí)現(xiàn)這個(gè)終極形態(tài),人形機(jī)器人需要做三件事:感知、運(yùn)動(dòng)、思考。

就拿跨越障礙物這件事情來(lái)說(shuō),得先“感知”到障礙物,然后“思考”是走過(guò)去、跳過(guò)去還是跨過(guò)去,最后“運(yùn)動(dòng)”或者說(shuō)行動(dòng)來(lái)實(shí)現(xiàn)跨越。這對(duì)普通人來(lái)說(shuō)只是下意識(shí)的行為,對(duì)人形機(jī)器人就是一個(gè)復(fù)雜的訓(xùn)練過(guò)程。

現(xiàn)在大部分的人形機(jī)器人的問(wèn)題都出在“思考”這個(gè)環(huán)節(jié)上,畢竟感知和運(yùn)動(dòng)可以通過(guò)傳感器布局、機(jī)器人關(guān)節(jié)設(shè)計(jì)的完善來(lái)在硬件上下功夫,不過(guò)“思考”這件事情實(shí)在是太復(fù)雜了。

以往大家的訓(xùn)練方式都是“打標(biāo)簽”,比如教人工智能學(xué)習(xí)什么叫做“西瓜”就把各式各樣的西瓜打上標(biāo)簽,人工智能在看到符合這個(gè)標(biāo)簽的物體的時(shí)候就可以給出相應(yīng)的認(rèn)知。不過(guò)這樣的訓(xùn)練方式放在有局限性的領(lǐng)域中還好,放在更大的領(lǐng)域中就很難做到窮盡。

現(xiàn)在有了大模型,就打開(kāi)了一種新的訓(xùn)練思路。大模型加上傳感器數(shù)據(jù),可以訓(xùn)練機(jī)器人更好地了解世界的規(guī)律。

比如同樣都是去冰箱里拿飲料,拿瓶裝可樂(lè)和袋裝牛奶的方式就不一樣,大模型學(xué)習(xí)可以讓機(jī)器人“理解”可樂(lè)可以直接捏起來(lái)而袋裝牛奶就要輕輕拎起來(lái)的區(qū)別。

更重要的是,大模型可以訓(xùn)練機(jī)器人對(duì)自然語(yǔ)言的理解,比如你說(shuō)“我餓了”,現(xiàn)在的機(jī)器人未必懂它需要做什么,但大模型訓(xùn)練之后,機(jī)器人就可以為你跳轉(zhuǎn)到外賣(mài)平臺(tái)的界面,更甚者可以給你去炒盤(pán)菜。對(duì)自然語(yǔ)言的深入理解,幫助機(jī)器人更好地理解人類(lèi),也能更大地減輕人類(lèi)與機(jī)器人的交互難度。

可以說(shuō),大模型的應(yīng)用又給人形機(jī)器人的發(fā)展推向了next level。

02 多方入局

在大模型的加持下,2023年被稱(chēng)為“人形機(jī)器人元年”。

從融資表現(xiàn)來(lái)看,據(jù)“IT桔子”數(shù)據(jù),2023年人形機(jī)器人領(lǐng)域融資事件有23起,總金額達(dá)到54.71億元,是過(guò)去十年以來(lái)的巔峰。而截至當(dāng)前,2024年人形機(jī)器人領(lǐng)域已經(jīng)有14起融資事件,總金額接近24億元。

圖源:IT桔子

從產(chǎn)品來(lái)看,2023年開(kāi)始至今,不論是新銳的產(chǎn)品還是企業(yè)都在涌現(xiàn)。比如2023年成立的星動(dòng)紀(jì)元,由清華大學(xué)交叉信息研究院孵化,致力于具身智能以及人形通用機(jī)器人技術(shù)和產(chǎn)品的研發(fā);同年成立的開(kāi)普勒,自研算法實(shí)現(xiàn)人形機(jī)器人預(yù)設(shè)動(dòng)作與端到端全自主規(guī)劃相結(jié)合模式及精準(zhǔn)控制...

還有趕在今年元旦之前上市的機(jī)器人賽道老牌選手優(yōu)必選,更是以“人形機(jī)器人第一股”的姿態(tài)給整個(gè)產(chǎn)業(yè)的資本化再次推上快車(chē)道。

以?xún)?yōu)必選為例,這些三方供應(yīng)商是整個(gè)領(lǐng)域的主力軍。這些企業(yè)基本都會(huì)以某種使用場(chǎng)景為切入來(lái)進(jìn)行人形機(jī)器人的研發(fā),比如優(yōu)必選更專(zhuān)注于工業(yè)制造、達(dá)闥更多面向家庭服務(wù)。作為整個(gè)產(chǎn)業(yè)鏈的中游,三方供應(yīng)商最重要的自然是爭(zhēng)取下游的訂單,趁早“進(jìn)廠”;所以,市場(chǎng)化、商業(yè)化就對(duì)他們非常重要。比如,今年2月,優(yōu)必選的Walker S已經(jīng)在合肥蔚來(lái)汽車(chē)工廠進(jìn)行“實(shí)調(diào)”;據(jù)“趣解商業(yè)”了解,優(yōu)必選已經(jīng)和數(shù)十家國(guó)內(nèi)頭部新能源汽車(chē)企業(yè)接觸,推進(jìn)人形機(jī)器人需求對(duì)接。

而這些“被進(jìn)廠”的下游企業(yè)當(dāng)中,也有部分開(kāi)始自己搞人形機(jī)器人的選手。

特斯拉,就是一個(gè)代表。機(jī)器人作為馬斯克的“宏圖計(jì)劃”當(dāng)中非常濃墨重彩的一筆,其機(jī)器人的代表作Optimus也一直都有進(jìn)展,如今已經(jīng)可以雙臂與腿配合完成基礎(chǔ)瑜伽動(dòng)作,與此同時(shí)保持軀干的穩(wěn)定性;還可以通過(guò)純視覺(jué)輸入,以正常的速度拿起積木,并能按照藍(lán)、綠兩類(lèi)顏色正確分類(lèi),在對(duì)面發(fā)生人為移動(dòng)積木的動(dòng)作時(shí),Optimus依舊能以自身原本的節(jié)奏順利完成任務(wù),且在積木擺放出錯(cuò)時(shí),自主調(diào)整正面朝上,完成糾錯(cuò)。

小米也早在2022年就發(fā)布了“Cyber one”,近期又聯(lián)手機(jī)器人泰斗王田苗,投資了一家名為"小雨智造"的具身智能科技公司,這也是小米首次對(duì)外投資具身智能領(lǐng)域公司;而本田入局機(jī)器人領(lǐng)域都已經(jīng)三十多年的時(shí)間,推出的ASIMO甚至在2002年就跑去和紐交所董事長(zhǎng)握手去了。

和中游供應(yīng)商有差別的是,下游企業(yè)的研發(fā)出了實(shí)用性還有品牌效應(yīng),尤其是這幾位都是現(xiàn)在典型的造車(chē)企業(yè),在汽車(chē)智能化勢(shì)不可擋的趨勢(shì)下,對(duì)于智能機(jī)器人的研究能讓車(chē)企更敏銳地捕捉前沿技術(shù),也展現(xiàn)自己的技術(shù)實(shí)力。

在去年的 1024 小鵬汽車(chē)科技日上,小鵬汽車(chē)董事長(zhǎng)兼CEO何小鵬推出了小鵬汽車(chē)自研的人形態(tài)雙足機(jī)器人 PX5;據(jù)“趣解商業(yè)”了解,小鵬團(tuán)隊(duì)耗時(shí) 5 個(gè)月,實(shí)現(xiàn)了自研雙足機(jī)器人的穩(wěn)定行走。

8月12日,何小鵬在微博上發(fā)布一則視頻,展示了一只機(jī)器手訂購(gòu)MONA M03的過(guò)程。何小鵬還表示:“AI及大型硬件的新進(jìn)展今年內(nèi)我們將跟大家同步,敬請(qǐng)期待?!彪m然微博透露的信息不多,但也能看出小鵬在積極布局機(jī)器人賽道。

在實(shí)用性上,中游廠商更重視“開(kāi)源”,因?yàn)橐伴_(kāi)張賣(mài)錢(qián)”,而下游廠家就更重視“節(jié)流”。馬斯克就表示Optimus量產(chǎn)之后也會(huì)率先進(jìn)入到特斯拉的生產(chǎn)流水線。用人形機(jī)器人代替工人擰螺絲,可以收獲一個(gè)24小時(shí)待機(jī)、不會(huì)疲勞、不會(huì)鬧情緒的“完美打工人”,成本降低、效率提升,最終實(shí)現(xiàn)的就是生產(chǎn)成本的控制。

當(dāng)然,下游廠商研發(fā)的人形機(jī)器人足夠穩(wěn)定后也可以進(jìn)行商業(yè)化,從而成為整個(gè)企業(yè)收入的一個(gè)增長(zhǎng)部分;不過(guò)從底層邏輯來(lái)說(shuō),雖然都是爭(zhēng)先“進(jìn)廠”,但中游和下游的側(cè)重點(diǎn)還是略微不同。

03 何時(shí)量產(chǎn)

不論是中游還是下游選手,雖然都熱熱鬧鬧的,但也各有各的麻煩。

特斯拉的人形機(jī)器人已經(jīng)開(kāi)始拖延量產(chǎn)時(shí)間了。去年就表示Optimus要在2024年底前實(shí)現(xiàn)量產(chǎn)的馬斯克在不久前發(fā)推稱(chēng)特斯拉明年會(huì)小批量的生產(chǎn)人形機(jī)器人,然后預(yù)期在2026年實(shí)現(xiàn)量產(chǎn)以及對(duì)其他企業(yè)客戶(hù)的交付;也就是說(shuō)整個(gè)機(jī)器人的進(jìn)展推后了幾乎一年。

小米的“Cyber One”在2022年亮相之后最后一次展示是在2023世界機(jī)器人大會(huì)上,而且展示的也是2022年的老版本,之后也沒(méi)傳來(lái)什么突破性的消息。

那么,人形機(jī)器人的困境到底在哪里?

首先是技術(shù)難關(guān)。有媒體曾經(jīng)報(bào)道,國(guó)內(nèi)一線研發(fā)專(zhuān)家在人形機(jī)器人系列電話會(huì)上提出了人形機(jī)器人量產(chǎn)的四個(gè)技術(shù)痛點(diǎn):

1.手部和腿部硬件集成難度大,需要更高的損失峰值功率和驅(qū)動(dòng)能力;

2.腿部行走算法穩(wěn)定性難以保證,學(xué)術(shù)界尚未出現(xiàn)真正意義上的類(lèi)人走行算法;

3.手部精細(xì)化感知難度大,涉及到手的21-26個(gè)自由度;

4.雙臂協(xié)同、混合智能操控和避讓等算法難度大,需要高維度的規(guī)劃。

其次是在成本層面。機(jī)器人的量產(chǎn)還得考慮軟硬件的成本控制,如何隨規(guī)模效應(yīng)逐漸均攤成本。

但這邊成本控制都還不成熟,那邊市場(chǎng)定價(jià)就已經(jīng)卷起來(lái)了。今年5月,宇樹(shù)科技發(fā)布的G1人形機(jī)器人售價(jià)只要9.9萬(wàn)元,用得著和用不著機(jī)器人的都沉默了,因?yàn)槿诵螜C(jī)器人的定價(jià)當(dāng)時(shí)還動(dòng)輒在百萬(wàn)元的區(qū)間。結(jié)果大家還沒(méi)為9.9萬(wàn)元這個(gè)定價(jià)吃驚多久,3.65萬(wàn)元售價(jià)的眾擎機(jī)器人發(fā)布的專(zhuān)業(yè)級(jí)雙足機(jī)器人SA01整機(jī)或散件套裝上市,主要面向科研教育市場(chǎng)發(fā)售。

這種兩極分化的情況就讓很多機(jī)器人廠商十分為難了,而這背后反應(yīng)的實(shí)際是人形機(jī)器人下游市場(chǎng)需求不明確的情況。這也是大部分高新技術(shù)產(chǎn)品市場(chǎng)化的問(wèn)題,由于高新技術(shù)產(chǎn)品對(duì)技術(shù)創(chuàng)新有極高要求,結(jié)果滿(mǎn)足要求的產(chǎn)品又太貴,所以中游廠家只能推出一個(gè)又一個(gè)便宜的版本。

還有就是,人形機(jī)器人在非結(jié)構(gòu)化場(chǎng)景中的應(yīng)用受限;由于機(jī)器人通用性不足,無(wú)法靈活應(yīng)對(duì)突發(fā)事件。人形機(jī)器人的商業(yè)化落地,最需要的是一個(gè)迫切又確切的場(chǎng)景;以現(xiàn)在的局面來(lái)看,高端制造需求下的工業(yè)化場(chǎng)景,以及人口老齡化趨勢(shì)下的生活化場(chǎng)景是商業(yè)化價(jià)值最高的場(chǎng)景。但是市場(chǎng)上仍缺少一個(gè)產(chǎn)品的典范,讓大家能更直觀地看到人形機(jī)器人的商業(yè)價(jià)值。

人形機(jī)器人能否真正取代人類(lèi)的部分重復(fù)勞作,還有很長(zhǎng)一段路要走;但人形機(jī)器人必然是未來(lái)的趨勢(shì),誰(shuí)能把這個(gè)“故事”具象化,誰(shuí)才是贏家。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。