正在閱讀:

耳機,AI硬件最容易突破的方向?

掃一掃下載界面新聞APP

耳機,AI硬件最容易突破的方向?

在所有人都幻想著下一代個人計算平臺的當下,主打便捷性的AI耳機,似乎成為AI硬件最容易突破的方向。

文|烏鴉智能說 

今年,被很多人看作是AI硬件的元年,很多公司發(fā)布了不少有趣的AI硬件,像AI Pin、Rabbit R1,但都有點高開低走的意思,評價最好的反而是只做AI+錄音機的Rewind Pendant。

可能是受到這個事情的啟發(fā),科技巨頭們開始紛紛盯上了另一種AI驅(qū)動的新設(shè)備——AI耳機。根據(jù)外媒報道,Meta平臺正在探索開發(fā)帶有攝像頭的人工智能耳機。而就在4月,字節(jié)跳動也收購了一家耳機公司。

相比AI Pin、Rabbit R1等AI硬件,AI耳機的好處在于,完全拋棄了顯示功能,在充分利用AI感知能力的同時,最大程度地優(yōu)化了便捷性,與手機形成了明顯的差異化。

畢竟,在光學顯示技術(shù)沒有革命性進步的前提下,足夠分辨率的顯示效果,就需要增加設(shè)備的體積,進而影響便捷性,以至于AI硬件很容易面臨靈魂拷問:既然都是要拿在手里,我為什么不用手機呢?

在所有人都幻想著下一代個人計算平臺的當下,主打便捷性的AI耳機,似乎成為AI硬件最容易突破的方向。

/ 01 / 科技巨頭扎堆AI耳機

這段時間,越來越多科技公司開始布局AI耳機。

據(jù)國外媒體報道,Meta平臺正在探索開發(fā)帶有攝像頭的人工智能耳機,希望這種設(shè)備能用來識別物體和翻譯外語。

Meta的首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)已經(jīng)看過了該設(shè)備的幾種可能設(shè)計,但一名員工表示,他還沒有對任何設(shè)計感到滿意。目前尚不清楚最終設(shè)計將是入耳式耳機還是頭戴式耳機。這個項目在Meta內(nèi)部被稱為“Camerabuds”。

OpenAI的CEO Sam Altman最近告訴一位合作伙伴,他和前蘋果首席設(shè)計師Jony Ive的設(shè)計公司LoveFrom已經(jīng)探索了開發(fā)帶攝像頭的耳機設(shè)備。不僅如此,蘋果也在探索在其耳機中加入攝像頭和AI。

據(jù)國外媒體報道,電子產(chǎn)品公司Ear Micro的Bear Clark表示,科技公司對開發(fā)“可聽穿戴設(shè)備”的興趣在過去八到十個月里激增。Clark說,最近有兩家大型科技公司聯(lián)系他,希望開發(fā)智能耳機,盡管他拒絕透露這些公司的名稱。

除了自行研發(fā)外,科技巨頭們也在通過收購布局耳機市場。根據(jù)媒體報道,字節(jié)跳動已于4月份收購OWS公司Oladance品牌大十科技,收購價格在3-5億元之間,目前字節(jié)跳動團隊人員已經(jīng)進駐大十科技。

收購Oladance或是字節(jié)推出AI眼鏡和AI手機的重要動作。據(jù)說創(chuàng)始人李浩乾將入職字節(jié)跳動,職級比大多類似的收購的CEO級別都要高,體現(xiàn)字節(jié)硬件的決心和戰(zhàn)略高度。

今年4月,由 Alphabet 旗下的神秘實驗室 Google X 孵化的Iyo,已經(jīng)推出了一款A(yù)I 藍牙耳機Iyo One。

Iyo One 的外觀和交互沒有 Ai Pin 那么激進,就是一副體型更大的藍牙耳機,沒有屏幕,不搞手勢,不搞投影,不搞觸摸,專注于自然語言的語音交互。在應(yīng)用場景上,創(chuàng)始人 Jason Rugolo 舉了一些例子,比如收到郵件或短信,不必拿出手機、滑動、打字,完全可以在坐著喝咖啡的時候,用耳朵接收信息。

至少從目前看,已經(jīng)有Meta、OpenAI、字節(jié)跳動等多家科技大廠有意布局AI耳機。

/ 02 / 把便攜性拉到極致

為什么這么科技公司會選擇耳機?在我看來,主要有以下兩個原因:

第一,盡管新的計算平臺尚未誕生,但基于過去硬件發(fā)展的經(jīng)驗,行業(yè)對下一代計算設(shè)備仍然有幾點共識:一個比手機更輕、更小、更便宜、更隨身的設(shè)備?;谶@幾點,眼鏡、耳機、項鏈、帽子等等一切可攜帶的物品,都被認為是可能的候選形態(tài)。

與AI Pin等AI硬件相比,AI耳機在便攜性方面有著天然優(yōu)勢。AI耳機基本完全拋棄了顯示這一交互方式,有利于最大程度放大便攜性優(yōu)勢。

根據(jù)怒喵科技CEO李楠的看法,光學顯示技術(shù)在三年內(nèi)不會有革命性的進步,因此要想做到有足夠分辨率的顯示效果,就需要增加設(shè)備的體積,而這勢必會影響便攜性。而便攜性恰恰是AI硬件最重要的屬性。

第二,耳機這個品類過去幾年在場景化方面取得了重要的突破,變得越來越重要。

手機滲透生活的歷史,也是耳機技術(shù)變革的歷史。智能手機時代耳機的變革分成三個階段:音質(zhì)驅(qū)動階段:耳機的主要改進聚焦在音質(zhì)提升;場景驅(qū)動階段:分別面向開放場景和封閉場景兩個方向發(fā)展;體驗驅(qū)動階段:為了能夠長時間佩戴,出現(xiàn)了 OWS 開放式可穿戴耳機,分別向掛耳耳機和夾耳耳機兩個方向發(fā)展。

隨著手機中音頻、視頻內(nèi)容占比的逐漸增加,人們對長時間佩戴耳機的需求越來越大。這標志著耳機從單一功能(僅用于聽音樂或打電話)的轉(zhuǎn)變?yōu)槎喙δ芷者m性產(chǎn)品,成為接收各類多媒體信息的設(shè)備。

也就是說,耳機已經(jīng)能夠完成多媒體內(nèi)容與日常信息交流的處理,是重要性、計算能力僅次于手機的第二大可攜帶計算設(shè)備。

基于以上兩點,在沒有新硬件形態(tài)的情況下,將便捷性拉到極致的耳機,似乎成為AI硬件最容易突破的方向。

/ 03 / 探索AI耳機的兩種思路

從目前看,AI耳機的探索大致有兩種思路:

AI耳機的第一種思路是AI+耳機,以耳機為硬件載體,通過更多交互方式,讓耳機成為下一個的個人計算中心,路徑有三:

一是,利用AI提升耳機的環(huán)境感知能力,不僅通過視覺感知環(huán)境,甚至加入視覺。比如,蘋果和Meta都在嘗試往耳機上面裝攝像頭。

根據(jù)彭博社爆料,蘋果從去年開始就研究帶有攝像頭的AirPods,代號為 “B798”。這款耳機的大小和現(xiàn)有AirPods幾乎相同,只不過內(nèi)嵌了低分辨率攝像頭。攝像頭可以用來拍照,以及通過AI實現(xiàn)多個功能,為用戶的日常生活提供協(xié)助。

二是通過技術(shù)實現(xiàn)更好的交互體驗。比如,GPT-4o把語音交互的延遲從2s降低到300ms,還給了極其豐富的音色表現(xiàn)力。

不久前,華盛頓大學也研發(fā)了一款名為Target Speech Hearing(TSH)的人工智能耳機系統(tǒng),它能夠通過佩戴者的注視來“鎖定”目標說話者,過濾掉環(huán)境中的其他聲音。

佩戴者只需將頭部對準目標說話者,注視3-5秒鐘后,輕按一個按鈕,系統(tǒng)便會開始捕捉并分析該說話者的聲音特征。此后,無論佩戴者如何移動,系統(tǒng)都會持續(xù)播放被“鎖定”的說話者的聲音,實現(xiàn)個性化的聽覺體驗。

三是基于更強的計算能力,提供更多的語音功能。比如,Iyo One 正式發(fā)布時,預(yù)計將有消息、電話、導航、音樂播放等語音功能,動動嘴巴就能回消息。

AI耳機的另一種思路是往現(xiàn)有耳機里增加AI功能,在原有的基礎(chǔ)上,利用AI技術(shù)補充一些功能,提供新的體驗。

比如,研發(fā)翻譯軟硬件產(chǎn)品的深圳公司 Wooask,推出了結(jié)合 ChatGPT 的新款觸屏耳機 TransBuds A8,支持實時翻譯 144 種語言,聲音傳到耳朵,文字則顯示在屏幕。

消費電子品牌 Nothing 也是這個思路,升級現(xiàn)有設(shè)備,而不是通過新的硬件重新發(fā)明輪子。

今年 4 月,Nothing 宣布,在 Nothing 手機安裝了最新 Nothing OS 和 ChatGPT 的用戶,可以直接通過 Nothing 耳機與 ChatGPT 對話,聯(lián)網(wǎng)后捏住耳機便能激活,捏住耳機就能和 AI 對話、問問題。

相比于后者,前者的路線無疑更加興奮。尤其當所有人都沉浸在AI創(chuàng)造下一個計算平臺的敘事里,AI耳機無疑為我們帶來了更多的可能性。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

耳機,AI硬件最容易突破的方向?

在所有人都幻想著下一代個人計算平臺的當下,主打便捷性的AI耳機,似乎成為AI硬件最容易突破的方向。

文|烏鴉智能說 

今年,被很多人看作是AI硬件的元年,很多公司發(fā)布了不少有趣的AI硬件,像AI Pin、Rabbit R1,但都有點高開低走的意思,評價最好的反而是只做AI+錄音機的Rewind Pendant。

可能是受到這個事情的啟發(fā),科技巨頭們開始紛紛盯上了另一種AI驅(qū)動的新設(shè)備——AI耳機。根據(jù)外媒報道,Meta平臺正在探索開發(fā)帶有攝像頭的人工智能耳機。而就在4月,字節(jié)跳動也收購了一家耳機公司。

相比AI Pin、Rabbit R1等AI硬件,AI耳機的好處在于,完全拋棄了顯示功能,在充分利用AI感知能力的同時,最大程度地優(yōu)化了便捷性,與手機形成了明顯的差異化。

畢竟,在光學顯示技術(shù)沒有革命性進步的前提下,足夠分辨率的顯示效果,就需要增加設(shè)備的體積,進而影響便捷性,以至于AI硬件很容易面臨靈魂拷問:既然都是要拿在手里,我為什么不用手機呢?

在所有人都幻想著下一代個人計算平臺的當下,主打便捷性的AI耳機,似乎成為AI硬件最容易突破的方向。

/ 01 / 科技巨頭扎堆AI耳機

這段時間,越來越多科技公司開始布局AI耳機。

據(jù)國外媒體報道,Meta平臺正在探索開發(fā)帶有攝像頭的人工智能耳機,希望這種設(shè)備能用來識別物體和翻譯外語。

Meta的首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)已經(jīng)看過了該設(shè)備的幾種可能設(shè)計,但一名員工表示,他還沒有對任何設(shè)計感到滿意。目前尚不清楚最終設(shè)計將是入耳式耳機還是頭戴式耳機。這個項目在Meta內(nèi)部被稱為“Camerabuds”。

OpenAI的CEO Sam Altman最近告訴一位合作伙伴,他和前蘋果首席設(shè)計師Jony Ive的設(shè)計公司LoveFrom已經(jīng)探索了開發(fā)帶攝像頭的耳機設(shè)備。不僅如此,蘋果也在探索在其耳機中加入攝像頭和AI。

據(jù)國外媒體報道,電子產(chǎn)品公司Ear Micro的Bear Clark表示,科技公司對開發(fā)“可聽穿戴設(shè)備”的興趣在過去八到十個月里激增。Clark說,最近有兩家大型科技公司聯(lián)系他,希望開發(fā)智能耳機,盡管他拒絕透露這些公司的名稱。

除了自行研發(fā)外,科技巨頭們也在通過收購布局耳機市場。根據(jù)媒體報道,字節(jié)跳動已于4月份收購OWS公司Oladance品牌大十科技,收購價格在3-5億元之間,目前字節(jié)跳動團隊人員已經(jīng)進駐大十科技。

收購Oladance或是字節(jié)推出AI眼鏡和AI手機的重要動作。據(jù)說創(chuàng)始人李浩乾將入職字節(jié)跳動,職級比大多類似的收購的CEO級別都要高,體現(xiàn)字節(jié)硬件的決心和戰(zhàn)略高度。

今年4月,由 Alphabet 旗下的神秘實驗室 Google X 孵化的Iyo,已經(jīng)推出了一款A(yù)I 藍牙耳機Iyo One。

Iyo One 的外觀和交互沒有 Ai Pin 那么激進,就是一副體型更大的藍牙耳機,沒有屏幕,不搞手勢,不搞投影,不搞觸摸,專注于自然語言的語音交互。在應(yīng)用場景上,創(chuàng)始人 Jason Rugolo 舉了一些例子,比如收到郵件或短信,不必拿出手機、滑動、打字,完全可以在坐著喝咖啡的時候,用耳朵接收信息。

至少從目前看,已經(jīng)有Meta、OpenAI、字節(jié)跳動等多家科技大廠有意布局AI耳機。

/ 02 / 把便攜性拉到極致

為什么這么科技公司會選擇耳機?在我看來,主要有以下兩個原因:

第一,盡管新的計算平臺尚未誕生,但基于過去硬件發(fā)展的經(jīng)驗,行業(yè)對下一代計算設(shè)備仍然有幾點共識:一個比手機更輕、更小、更便宜、更隨身的設(shè)備?;谶@幾點,眼鏡、耳機、項鏈、帽子等等一切可攜帶的物品,都被認為是可能的候選形態(tài)。

與AI Pin等AI硬件相比,AI耳機在便攜性方面有著天然優(yōu)勢。AI耳機基本完全拋棄了顯示這一交互方式,有利于最大程度放大便攜性優(yōu)勢。

根據(jù)怒喵科技CEO李楠的看法,光學顯示技術(shù)在三年內(nèi)不會有革命性的進步,因此要想做到有足夠分辨率的顯示效果,就需要增加設(shè)備的體積,而這勢必會影響便攜性。而便攜性恰恰是AI硬件最重要的屬性。

第二,耳機這個品類過去幾年在場景化方面取得了重要的突破,變得越來越重要。

手機滲透生活的歷史,也是耳機技術(shù)變革的歷史。智能手機時代耳機的變革分成三個階段:音質(zhì)驅(qū)動階段:耳機的主要改進聚焦在音質(zhì)提升;場景驅(qū)動階段:分別面向開放場景和封閉場景兩個方向發(fā)展;體驗驅(qū)動階段:為了能夠長時間佩戴,出現(xiàn)了 OWS 開放式可穿戴耳機,分別向掛耳耳機和夾耳耳機兩個方向發(fā)展。

隨著手機中音頻、視頻內(nèi)容占比的逐漸增加,人們對長時間佩戴耳機的需求越來越大。這標志著耳機從單一功能(僅用于聽音樂或打電話)的轉(zhuǎn)變?yōu)槎喙δ芷者m性產(chǎn)品,成為接收各類多媒體信息的設(shè)備。

也就是說,耳機已經(jīng)能夠完成多媒體內(nèi)容與日常信息交流的處理,是重要性、計算能力僅次于手機的第二大可攜帶計算設(shè)備。

基于以上兩點,在沒有新硬件形態(tài)的情況下,將便捷性拉到極致的耳機,似乎成為AI硬件最容易突破的方向。

/ 03 / 探索AI耳機的兩種思路

從目前看,AI耳機的探索大致有兩種思路:

AI耳機的第一種思路是AI+耳機,以耳機為硬件載體,通過更多交互方式,讓耳機成為下一個的個人計算中心,路徑有三:

一是,利用AI提升耳機的環(huán)境感知能力,不僅通過視覺感知環(huán)境,甚至加入視覺。比如,蘋果和Meta都在嘗試往耳機上面裝攝像頭。

根據(jù)彭博社爆料,蘋果從去年開始就研究帶有攝像頭的AirPods,代號為 “B798”。這款耳機的大小和現(xiàn)有AirPods幾乎相同,只不過內(nèi)嵌了低分辨率攝像頭。攝像頭可以用來拍照,以及通過AI實現(xiàn)多個功能,為用戶的日常生活提供協(xié)助。

二是通過技術(shù)實現(xiàn)更好的交互體驗。比如,GPT-4o把語音交互的延遲從2s降低到300ms,還給了極其豐富的音色表現(xiàn)力。

不久前,華盛頓大學也研發(fā)了一款名為Target Speech Hearing(TSH)的人工智能耳機系統(tǒng),它能夠通過佩戴者的注視來“鎖定”目標說話者,過濾掉環(huán)境中的其他聲音。

佩戴者只需將頭部對準目標說話者,注視3-5秒鐘后,輕按一個按鈕,系統(tǒng)便會開始捕捉并分析該說話者的聲音特征。此后,無論佩戴者如何移動,系統(tǒng)都會持續(xù)播放被“鎖定”的說話者的聲音,實現(xiàn)個性化的聽覺體驗。

三是基于更強的計算能力,提供更多的語音功能。比如,Iyo One 正式發(fā)布時,預(yù)計將有消息、電話、導航、音樂播放等語音功能,動動嘴巴就能回消息。

AI耳機的另一種思路是往現(xiàn)有耳機里增加AI功能,在原有的基礎(chǔ)上,利用AI技術(shù)補充一些功能,提供新的體驗。

比如,研發(fā)翻譯軟硬件產(chǎn)品的深圳公司 Wooask,推出了結(jié)合 ChatGPT 的新款觸屏耳機 TransBuds A8,支持實時翻譯 144 種語言,聲音傳到耳朵,文字則顯示在屏幕。

消費電子品牌 Nothing 也是這個思路,升級現(xiàn)有設(shè)備,而不是通過新的硬件重新發(fā)明輪子。

今年 4 月,Nothing 宣布,在 Nothing 手機安裝了最新 Nothing OS 和 ChatGPT 的用戶,可以直接通過 Nothing 耳機與 ChatGPT 對話,聯(lián)網(wǎng)后捏住耳機便能激活,捏住耳機就能和 AI 對話、問問題。

相比于后者,前者的路線無疑更加興奮。尤其當所有人都沉浸在AI創(chuàng)造下一個計算平臺的敘事里,AI耳機無疑為我們帶來了更多的可能性。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。