文/曹雙濤
編輯/楊博丞
跨境游熱度不減、出海成為當(dāng)前中企的“必答題”、AI大模型技術(shù)持續(xù)升級等多重因素共同推動,AI耳機(jī)市場持續(xù)火熱。繼2024年為“AI耳機(jī)元年”,AI耳機(jī)為耳機(jī)品類中增長最快的子賽道之一。
2025年AI耳機(jī)熱度持續(xù)不減,洛圖科技線上監(jiān)測數(shù)據(jù)顯示,2025年Q1,傳統(tǒng)主流電商平臺,0-1000元價格段的AI耳機(jī)銷量同比增長近16倍至19.9萬副,占比達(dá)52.1%,較2024年提升了19.4個百分點(diǎn)。
1000-1500元價格段,傳統(tǒng)主流電商的銷量同比漲幅超過5倍至15.9萬副,占比為41.7%,但受入門級和高端產(chǎn)品兩頭的擠壓,較去年同期減少24.8個百分點(diǎn)。
AI耳機(jī)的火熱,也在帶動產(chǎn)業(yè)鏈和相關(guān)企業(yè)發(fā)展。以成立于2021年、科大訊飛孵化的未來智能為例,其CEO馬嘯將未來智能化的創(chuàng)業(yè)歷程濃縮為幾組數(shù)據(jù):
但我們在和多位未來智能AI耳機(jī)用戶深入交流后,讓我們看到其高增長的另一面:延時問題帶來的溝通不順,勸退大量外貿(mào)用戶;使用環(huán)境要求較高,帶來的翻譯準(zhǔn)確度欠佳,引發(fā)用戶不滿;真實(shí)對話場景的復(fù)雜性,讓未來智能AI耳機(jī)功能需優(yōu)化的功能還要很多。
重要的是,大量廠商的涌入以及華強(qiáng)北的快節(jié)奏打法,讓當(dāng)前AI耳機(jī)市場愈發(fā)呈現(xiàn)兩極化格局。上述問題的存在,讓未來智能AI耳機(jī)能否持續(xù)火熱仍值得商榷。
一、延時困境,AI耳機(jī)致命短板
未來智能AI耳機(jī)翻譯功能延遲測試為:1)面對面翻譯模式,說話完成后1-2S完成翻譯,2-3S開始播報翻譯;2)同傳聽譯需要自動斷句,延遲相對面對面較高。說話完成后,3-4S完成翻譯,5-10S開始播報翻譯。(上述數(shù)據(jù)為實(shí)驗(yàn)室測試數(shù)據(jù),實(shí)際使用會受到網(wǎng)絡(luò)與現(xiàn)場環(huán)境不同,存在一定差異,具體因人而異)
但AI耳機(jī)的延時問題,已成為外貿(mào)核心溝通場景的顯著痛點(diǎn)。從事外貿(mào)行業(yè)多年的劉航(化名)對我們說道,自己在使用包括未來智能、時空壺等多家廠家的AI耳機(jī)后發(fā)現(xiàn),AI耳機(jī)對外貿(mào)實(shí)際工作幫助有限。
一方面,在國外街頭向陌生人問路時,對方或能寬容AI耳機(jī)幾秒鐘的語音轉(zhuǎn)譯延時。但不管是電話溝通或是商務(wù)會談,很多海外客戶不僅不愿意等待,甚至延時問題更會讓客戶隨時掛斷電話、面對面交流現(xiàn)場陷入尷尬。
比如,雙方討論復(fù)雜技術(shù)細(xì)節(jié)或產(chǎn)品規(guī)格時,信息傳達(dá)需要高度準(zhǔn)確和及時。延遲會讓技術(shù)術(shù)語、參數(shù)、問答環(huán)節(jié)變得混亂且不順暢。再比如,和客戶確認(rèn)價格后,延時問題選擇停頓幾秒再回復(fù),客戶難免會在這短暫空白中滋生疑慮——是我們的報價超出預(yù)期區(qū)間?還是我方在合作誠意上有所保留?這種因等待產(chǎn)生的心理間隙,極可能悄然埋下信任裂痕,讓原本達(dá)成的共識蒙上不確定性陰影。
另一方面,外貿(mào)企業(yè)客戶來自全球各地,語言習(xí)慣和工作方式存在較大差異。比如,德語以復(fù)合句著名,喜歡嵌套從句來構(gòu)建邏輯嚴(yán)謹(jǐn)、信息高度集成的完整意思。俄語語法結(jié)構(gòu)復(fù)雜,常使用長復(fù)合句來表達(dá)豐富信息,正式書面語和演講中可見到很多冗長的句式。北歐文化強(qiáng)調(diào)共識和深思熟慮,語速通常比南歐慢,表達(dá)傾向于清晰、完整、有條理。
若是合作多年的老客戶,你可以委婉地告知客戶語速稍微放慢、盡量別使用長句子溝通。但首次電話溝通的新客戶,你又要如何要求客戶呢?AI耳機(jī)轉(zhuǎn)移長句帶來更長的延時,很容易會讓新客戶覺得公司專業(yè)度和嚴(yán)謹(jǐn)度欠佳,難以促成雙方合作。
和劉航相同感受的也有從事外貿(mào)多年的張磊(化名),張磊坦言,若AI耳機(jī)真能在實(shí)際工作場景中派上用場,作為常年往返中美的外貿(mào)人,我又何苦費(fèi)時費(fèi)力學(xué)英語?自己在體驗(yàn)多家廠商的 AI 耳機(jī)后,AI耳機(jī)僅是廠家的營銷概念和“自嗨”。
和老外溝通就像下國際象棋,每走一步都要按一次計(jì)時器。使用AI耳機(jī)每次開口都得先按下暫停鍵等翻譯,重復(fù)操作不僅麻煩,讓整個交流節(jié)奏支離破碎。更重要的是,自己都不好意思這種溝通方式,更別提大多數(shù)國家的客戶根本沒耐心等待。
以美國、德國為代表的歐美國家,時間=金錢文化深入骨髓,商務(wù)談判追求直接、高效、速戰(zhàn)速決。使用AI耳機(jī)頻繁翻譯等待,不僅會讓客戶質(zhì)疑公司的專業(yè)度以及合作準(zhǔn)備度,更會讓客戶覺得自己不被尊重,嚴(yán)重?fù)p害雙方建立的信任關(guān)系。
除延時問題外,聯(lián)網(wǎng)使用問題和小語種問題同樣是外貿(mào)用戶使用AI耳機(jī)的痛點(diǎn)。從事外貿(mào)多年的曹陽(化名)表示,一方面,未來智能AI耳機(jī)僅支持中英文離線使用,其他語言需聯(lián)網(wǎng)使用。但海外并不是所有國家能像國內(nèi)已實(shí)現(xiàn)5G覆蓋,不少國家較差的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,讓未來智能AI耳機(jī)在進(jìn)行多語言翻譯時,延時問題被進(jìn)一步放大。
比如,非洲的索馬里固定網(wǎng)絡(luò)寬帶速度僅為7-9兆比特/秒;南美的委內(nèi)瑞拉平均網(wǎng)速僅1.6Mbps,寬帶頁面加載速度為全球最慢。
另一方面,未來智能AI耳機(jī)雖支持英語、法語、日語、韓語等多語言實(shí)時翻譯,很多小語種并不支持。但隨著全球貿(mào)易環(huán)境復(fù)雜多變,許多外貿(mào)企業(yè)陸續(xù)攻入這些小語種國家市場。有同行稱,在實(shí)際使用未來智能AI耳機(jī)翻譯哈薩克斯坦時,錯誤頻發(fā)的情況令人頭疼。無論是商務(wù)談判還是日常溝通,翻譯內(nèi)容都存在明顯偏差。
聯(lián)系訊飛技術(shù)人員后,對方雖承認(rèn)存在翻譯效果缺陷,但短期內(nèi)無法解決。這讓同行倍感無奈與不滿,畢竟花費(fèi)一兩千元購買的AI耳機(jī),就是為了保障與外商溝通的精準(zhǔn)性。如今翻譯頻頻“翻車”,產(chǎn)品的性價比與實(shí)用性大打折扣,著實(shí)難以令人滿意。
多位外貿(mào)人對未來智能AI耳機(jī)體驗(yàn)欠佳,本質(zhì)上也是當(dāng)前AI耳機(jī)面臨多重代解問題,這正是以未來智能為代表的廠商未來想要持續(xù)提升銷量的難題。
一是長句處理和即時響應(yīng)的矛盾。高質(zhì)量的翻譯需要捕捉到相對完整的語義單元才能開始翻譯,否則準(zhǔn)確度會驟降。但等待用戶說完一個意思,本身就引入“等待延遲”。且語言越復(fù)雜、長句越多,需要的輸入時間就越長。
因此更大型、更復(fù)雜的AI模型雖能帶來更高的準(zhǔn)確性和自然度,但計(jì)算耗時更長。在芯片性能和網(wǎng)絡(luò)帶寬不無限供給的前提下,需要在“精度/效果”和“速度”之間做痛苦的權(quán)衡和取舍。
二是當(dāng)前AI耳機(jī)面臨著無法脫離手機(jī),成為獨(dú)立硬件設(shè)備使用的現(xiàn)實(shí)尷尬。未來智能CTO王松曾表示,真正的智能耳機(jī)必須是一個可獨(dú)立聯(lián)網(wǎng)、獨(dú)立運(yùn)算的設(shè)備,即便脫離手機(jī)也能夠使用。
但AI耳機(jī)體積小、重量輕,計(jì)算跟存儲的能力受到限制,通常需要依賴手機(jī)等外部設(shè)備接入云端的大模型來完成AI功能,這就出現(xiàn)沒有手機(jī)就完成不了AI功能的問題。但各國網(wǎng)絡(luò)基礎(chǔ)設(shè)施的較大差異,短期內(nèi)很難解決。
三是小語種的訓(xùn)練數(shù)據(jù)少、語言結(jié)構(gòu)復(fù)雜、專業(yè)詞庫空白、技術(shù)鏈斷裂等問題,和小語種使用人群相對不高帶來的商業(yè)回報低,讓廠商對小語種投入的資源有限。但不同外貿(mào)企業(yè)的客戶具有典型的個性化、差異化,這種矛盾問題短期內(nèi)很難找到較好的解決方案。
二、嘈雜環(huán)境“軟肋”,翻譯準(zhǔn)確度的困境
除延時和小語種問題外,當(dāng)前包括未來智能AI耳機(jī)在內(nèi)的多家廠商更青睞使用“AI會議耳機(jī)”宣傳的背后,實(shí)則和會議場景下相對安靜,來自外界的不可控聲音相對較低有關(guān)。但用戶使用AI耳機(jī)的場景復(fù)雜,直接影響AI耳機(jī)翻譯的準(zhǔn)確度。
有抖音網(wǎng)友在巴基斯坦展會現(xiàn)場對訊飛AI耳機(jī)實(shí)測后發(fā)現(xiàn),因展會現(xiàn)場涌入各種聲音,訊飛AI耳機(jī)的翻譯效果大打折扣。
比如,“因?yàn)槲覀兠磕暧?8個月”,不僅出現(xiàn)明顯常識錯誤,且未結(jié)合實(shí)際語義進(jìn)行靈活調(diào)整。“IDP,一個是中國人,來自中國。那你有自己的嗎?”表述較為生硬,語義不明?!肮荆阏J(rèn)為我們在一個較大的地區(qū)生產(chǎn)這種時間花費(fèi)不是很多的企業(yè)”,存在語序混亂、表意不清、不符合中文表達(dá)邏輯的問題。
圖源:抖音@大寶YCsolar
未來智能AI耳機(jī)用戶劉楠(化名)同樣表示,未來智能AI耳機(jī)在海外使用時,需要聯(lián)網(wǎng)且周圍環(huán)境保持絕對安靜,才能做到翻譯準(zhǔn)確。但在如商場、餐廳等嘈雜的環(huán)境下,AI耳機(jī)會錄制到不同聲音,整個翻譯效果明顯欠佳。甚至面對面的交流,還不如手機(jī)自帶翻譯更實(shí)用。
更糟糕的是,有次給孩子開家長會,班主任英語和法語混合使用,AI耳機(jī)更是顯得無用。當(dāng)時花費(fèi)一兩千元購買的未來智能AI耳機(jī),如今只能拿來聽歌用。
張磊表示,漢語言的魅力在于同樣一句話,在不同場景、不同語氣配合不同動作表達(dá)下,有著不同含義。甚至很多場景下,更要聽懂對方的言外之意。這正是中國人的一生都在學(xué)習(xí)察言觀色,學(xué)會說話滴水不漏的原因。自己在和大量美國客戶和美國家庭深入接觸后發(fā)現(xiàn),英語同樣存在和漢語言類似問題。
比如,當(dāng)老外挑眉說“Interesting”時,你能直接使用AI耳機(jī)翻譯的“贊美”來繼續(xù)溝通嗎?對時間觀念看重的老外,在你遲到時說道“What perfect timing!”按照AI耳機(jī)翻譯的“來得正好”繼續(xù)溝通,很容易激怒客戶。這正是自己仍在堅(jiān)持學(xué)習(xí)英語,以及重要商務(wù)場合或帶著同聲翻譯或聘請當(dāng)?shù)厝伺阃脑颉?/p>
網(wǎng)友實(shí)測以及劉楠和張磊話語的背后,本質(zhì)上也是對AI耳機(jī)的終極拷問??垢蓴_、降噪等問題廠商雖能通過技術(shù)手段來解決,但人類溝通本質(zhì)是聲波+體感+文化場的量子糾纏態(tài),溝通的復(fù)雜性讓AI耳機(jī)如何從“安靜會議室里的玩具”,真正變成外貿(mào)用戶的強(qiáng)剛需產(chǎn)品呢?沒有剛需性支撐,未來AI耳機(jī)市場到底靠什么延續(xù)當(dāng)前的火熱呢?
更需指出的是,當(dāng)前的AI耳機(jī)市場更是需要一個持續(xù)培養(yǎng)用戶習(xí)慣的市場。比如,很多場景下用戶佩戴耳機(jī),多是傳遞“免打擾”或“在休息”的意味。但用戶和耳機(jī)對話,自言自語很容易讓人覺得誤解。
宮城同樣指出,一方面用戶不習(xí)慣戴上耳機(jī)之后自言自語,在戶外這也會是一個“讓i人尷尬”的場景,更不習(xí)慣凡事都要問AI。
另一方面為了達(dá)到“陪伴”的效果,很多AI耳機(jī)都做成開放式,使得用戶戴上很久也不會耳道不適,但是這樣的形態(tài)不隔音不降噪,在商場等嘈雜環(huán)境里使用體驗(yàn)很差。降噪和體驗(yàn)感,難以平衡。
三、行業(yè)困局,創(chuàng)新乏力與市場兩極化加劇
上述問題的存在,讓AI耳機(jī)行業(yè)不僅難以出現(xiàn)巔峰式創(chuàng)新,且市場愈發(fā)呈現(xiàn)兩極化格局——以“華強(qiáng)北”為代表的白牌廠家持續(xù)收割國內(nèi)外低價帶市場,大量品牌廠家圍繞高價格帶競爭愈發(fā)白熱化、擁擠化,這也是未來智能AI耳機(jī)想要持續(xù)提升銷量的阻力。
華強(qiáng)北某家AI耳機(jī)工廠的負(fù)責(zé)人劉峰(化名)坦言,和大企業(yè)追求商業(yè)模式、流程規(guī)則不同的是,華強(qiáng)北做AI耳機(jī)主打“快”和“追求極致成本”。在華強(qiáng)北看來,AI耳機(jī)本質(zhì)上消費(fèi)電子行業(yè)的快消品。
這意味著想要在當(dāng)前火熱的AI耳機(jī)市場賺到錢,一是要搶單速度更快,畢竟整個行業(yè)沒有清晰規(guī)則可言,只要能搞定國內(nèi)外客戶即可。
二是產(chǎn)品升級和迭代速度要快,不管白貓、黑貓,能提前抓住當(dāng)前大量對AI耳機(jī)感興趣的用戶,讓工廠賺到錢生存下去才是“好貓”。甚至當(dāng)前華強(qiáng)北圍繞AI耳機(jī)的迭代速度,有可能比大廠還要快。
三是AI耳機(jī)白牌市場本質(zhì)上一個價格敏感型市場,工廠通過嚴(yán)格控制成本帶來的AI耳機(jī)價格下探,將持續(xù)帶動工廠銷量提升。
和華強(qiáng)北打法不同的是,當(dāng)前大廠布局AI耳機(jī)面臨的難題不同。以紐曼、飛利浦為代表的音頻品牌雖在音頻技術(shù)積累、用戶基礎(chǔ)、品牌知名度等方面具有優(yōu)勢,但AI能力卻是這些企業(yè)的短板。
比如,紐曼和飛利浦分別接入百度文心一言和騰訊混元大模型。宮城同樣指出,雖然音頻品牌在音質(zhì)調(diào)教上具有優(yōu)勢,但近些年在AI功能上轉(zhuǎn)型較慢,價格很高的情況下顯得產(chǎn)品比較雞肋。
圖源:基于公開信息整理 DoNews制圖
以蘋果、華為、小米為代表的手機(jī)廠商,強(qiáng)大的手機(jī)出貨量、對經(jīng)銷商具有較高的話語權(quán)、兼具手機(jī)操作系統(tǒng)和生態(tài)優(yōu)勢,讓手機(jī)廠商無疑成為AI耳機(jī)市場最有優(yōu)勢的玩家。
援引《彭博社》報道,蘋果今年即將推出的新功能包括AirPods和Siri語音助手的實(shí)時翻譯模式、Vision Pro耳機(jī)上的眼球滾動選項(xiàng)。但手機(jī)系統(tǒng)里的各個應(yīng)用,到底會給手機(jī)廠商開發(fā)權(quán)限到何種地步,也需要平衡。
以未來智能、豆包、百度、時空壺為代表的互聯(lián)網(wǎng)大廠和數(shù)碼公司,或在流量或在技術(shù)積累上占據(jù)優(yōu)勢。比如,為打造軟硬件協(xié)同,豆包只能由Ola Friend耳機(jī)喚醒,其他耳機(jī)無法喚醒。
但互聯(lián)網(wǎng)大廠和數(shù)碼公司面臨的難題有很多:一方面,AI耳機(jī)對手機(jī)依賴問題短期內(nèi)無解,這很容易出現(xiàn)手機(jī)后臺操作系統(tǒng)“殺進(jìn)程”的情況,影響用戶體驗(yàn)。
另一方面,當(dāng)前AI耳機(jī)的如通話錄音功能、現(xiàn)場錄音功能、實(shí)時字幕和翻譯功能、面對面交流功能等,隨著手機(jī)廠商圍繞AI功能的持續(xù)創(chuàng)新,未來這些功能到底會有多少被手機(jī)代替呢?
更甚至說,隨著當(dāng)前消費(fèi)者愈發(fā)理性化和愈發(fā)關(guān)注性價比,AI作為獨(dú)立硬件未來是否會有存在必要的嗎?AI耳機(jī)相較手機(jī),真正的差異化、剛需化、不可替代的功能又是什么呢?在兩極化和競爭慘烈的市場中,未來智能又要如何持續(xù)殺出重圍呢?