文|張書樂
智能音箱,到底是不是雞肋。
如果讓微軟回答,或許是有嚼頭的雞肋,先留著。
但如果這個(gè)雞肋價(jià)值200億美元,你還覺得微軟只是將其看作是雞肋嗎!
近日,微軟宣布完成對(duì)老牌智能語(yǔ)音廠商N(yùn)uance的收購(gòu),Nuance正式從納斯達(dá)克證券交易所摘牌退市。
據(jù)悉,此次收購(gòu)的交易額為200億美元。
微軟于去年4月宣布收購(gòu)Nuance,兩家公司稱將共同開創(chuàng)人工智能未來(lái), 在其幫助下,醫(yī)療人員能夠減少在文檔記錄上花費(fèi)的時(shí)間,而更多與病人相處,將共同利用人工智能的力量,幫助各行各業(yè)的組織創(chuàng)造無(wú)摩擦、個(gè)性化的客戶體驗(yàn)。
顯然,進(jìn)擊的方向非常明確:專業(yè)方向AI語(yǔ)音。
而在國(guó)內(nèi),過(guò)去過(guò)于泛大眾化卻由于智能程度不高而形同雞肋的智能音箱廠商們,也在轉(zhuǎn)向。
日前。思必馳旗下智能硬件品牌“思麥耳”推出了首款產(chǎn)品,即360°降噪會(huì)議麥克風(fēng)音箱,具有智能降噪、免費(fèi)音頻實(shí)時(shí)轉(zhuǎn)寫等功能。
主打商務(wù)功能、走專業(yè)化路線,成為了思必馳的目標(biāo)。
與之類似的還有云知聲。
從2017年至2020年上半年,云知聲分別投入553.03萬(wàn)元、1166.93萬(wàn)元、6071.15萬(wàn)元和1755.80萬(wàn)元,面向物聯(lián)網(wǎng)領(lǐng)域的“雨燕”和面向小家電市場(chǎng)的“蜂鳥”系列芯片已量產(chǎn)和規(guī)模銷售,“雪豹”車規(guī)級(jí)芯片尚在進(jìn)行穩(wěn)定性測(cè)試。
而在此次北京冬奧會(huì)上,也可以看到國(guó)內(nèi)人工智能語(yǔ)音公司的聲影。
聲智科技承擔(dān)的“冬奧核酸應(yīng)檢盡檢決策系統(tǒng)”、冬奧核酸“聲智門”(IDA數(shù)字哨點(diǎn)系統(tǒng))、“冬奧賽事綜合保障組指揮調(diào)度平臺(tái)”、“冬奧大腦-冬奧人員信息分析系統(tǒng)”等4項(xiàng)數(shù)字基礎(chǔ)設(shè)施,構(gòu)成了確保冬奧安全的一道道保險(xiǎn)繩。
對(duì)此,《中國(guó)經(jīng)營(yíng)報(bào)》的曲忠芳和書樂進(jìn)行了一番交流,貧道以為:
逃離客廳,正在成為智能音箱的趨勢(shì)。
AI語(yǔ)音技術(shù)目前來(lái)說(shuō)整體“智商”還滿足不了消費(fèi)者的高期望值,AI公司希望通過(guò)智能音箱和消費(fèi)者交互來(lái)達(dá)成所謂深度學(xué)習(xí)和個(gè)性化服務(wù)的能力,目前也沒實(shí)質(zhì)性的突破。
因此,針對(duì)專業(yè)領(lǐng)域進(jìn)行突破,將智能的理解能力控制在較窄的領(lǐng)域,反而是看起來(lái)更智能、其實(shí)很雞賊的一種打法。
表面上,AI語(yǔ)音承載體依然是智能音箱,倒不是說(shuō)智能音箱是目前AI語(yǔ)音最成熟的商業(yè)模式。
事實(shí)上,智能音箱只是語(yǔ)音技術(shù)中一個(gè)容易被普通人掌握和熟悉的工具,本質(zhì)上依然是個(gè)播放器,只是有一定人工智能語(yǔ)音識(shí)別功能。
整體并沒有突破一個(gè)音箱的格局,也沒有達(dá)成智能家居行業(yè)此前所期待的以智能音箱為智能家居的連接樞紐功能。
但在商業(yè)場(chǎng)景下的AI語(yǔ)音環(huán)境中,依然要這個(gè)具象作為承載罷了。
而且較之智能家居所需求的多功能體驗(yàn),商業(yè)場(chǎng)景的訴求簡(jiǎn)單反而容易突破。
在這一點(diǎn)上,微軟之所以花費(fèi)200億美元進(jìn)行收購(gòu),其用心也很容易理解。
畢竟,在AI語(yǔ)音上,目前全球水平大同小異,主要在于AI語(yǔ)音技術(shù)目前來(lái)說(shuō)整體“智商”堪憂,而通過(guò)智能音箱和消費(fèi)者交互來(lái)達(dá)成所謂深度學(xué)習(xí)和個(gè)性化服務(wù)的能力,目前也沒實(shí)質(zhì)性的突破。
先期占子布局,避免真正行業(yè)大爆發(fā)時(shí)落后,甚至謀求技術(shù)率先突破,成為了200億美元重注的根本落腳點(diǎn)。
之所以如此選擇,就在于語(yǔ)音一直被看作是一個(gè)人機(jī)互動(dòng)的潛力入口,是最容易達(dá)成泛大眾化的可能方向,而且也是人與人交流的最原始場(chǎng)景,也同樣更容易在人與模仿人類的AI中被認(rèn)同。