報告服務熱線400-068-7188

一支錄音筆里的江湖

分享到:
20 新眸 ? 2021-06-07 10:05:02  來源:新眸 E2293G0

作者|凌石     來源|新眸(ID:xinmouls)

“市場與技術(shù)的匹配度問題,需要找到破壞性技術(shù)的新利基市場。”克萊頓·克里斯坦森曾在《創(chuàng)新者的窘境》一書中寫到,這一邏輯同樣也適用于錄音筆行業(yè)。

新眸注:利基市場是指在較大的細分市場中具有相似興趣或需求的一小群顧客所占有的市場空間,大多數(shù)成功的創(chuàng)業(yè)型企業(yè)一開始并不在大市場開展業(yè)務,而是通過識別較大市場中新興的或未被發(fā)現(xiàn)的利基市場而發(fā)展業(yè)務。

搜索錄音筆詞條,你會發(fā)現(xiàn)人們將錄音筆分為三代,第一代為磁帶錄音筆,第二代為數(shù)碼錄音筆,第三代為智能錄音筆,這也恰好對應著錄音筆的演進三階段。

磁帶錄音筆流行于1835-1998年間,這一時期的代表玩家主要是飛利浦、索尼,磁帶錄音過程大致是這樣的:先經(jīng)過專門的處理,聲音轉(zhuǎn)化為能引起帶上的粉粒磁化的電信號,當磁帶播放的時候,這些磁性粉粒放出相同的電信號,又轉(zhuǎn)化成了聲音。大多數(shù)人并不知道它在錄音技術(shù)中所扮演的角色,但它的確是一個關鍵性突破。

數(shù)碼錄音筆流行于1999-2018年間,也是我們所熟悉的,主要代表玩家依然是飛利浦和索尼。與傳統(tǒng)錄音機相比,數(shù)碼錄音筆是通過數(shù)字存儲的方式來記錄音頻的,為了便于操作和提升錄音質(zhì)量造型并非以單純的筆型為主,同時擁有多種功能,如激光筆功能、FM調(diào)頻、MP3播放等。

2018年之后,AI語音技術(shù)得到突破后,錄音筆的玩家格局和功能形態(tài)發(fā)生改變,我們所熟知的科大訊飛、搜狗等玩家登上歷史舞臺(這里有一個小細節(jié),最早在錄音方面的應用是通過需要轉(zhuǎn)寫的錄音時長來進行收費,之后才出現(xiàn)了終身免費轉(zhuǎn)寫的智能錄音筆硬件),其中訊飛智能錄音筆規(guī)格較多,距今共計發(fā)布9款(SR101、SR301 、SR501、SR502、SR701、SR702、SR901、R1以及SR302)。

一個明顯的感知是,每一次技術(shù)革新與消費升級的雙輪驅(qū)動都會產(chǎn)生顛覆式創(chuàng)新的機會,進入到移動互聯(lián)網(wǎng)時代后,人工智能技術(shù)的發(fā)展給傳統(tǒng)錄音筆產(chǎn)業(yè)帶來的創(chuàng)新機會?;诖?,本文新眸將著重拆解錄音筆江湖的前生今世。

01

錄音筆“編年史”

利用機器對語音進行錄制、播放,已有百年歷史。

1879年,“科學界的拿破侖”愛迪生將留聲機帶到了在法國巴黎世界博覽會上,這是人類歷史上首次利用工具對聲音的重現(xiàn)。但是,在當時留聲機僅作為上層社會的珍藏,未能普及到民用。

1888年,科學家O·史密斯在一篇論文中提到“利用剩磁技術(shù)進行錄音”,這篇論文給錄音機提供了理論基礎,早期鋼絲錄音機、鋼帶錄音機開始出現(xiàn)。在之后的半個多世紀里,錄音機技術(shù)并沒有取得突破性進展,直到1935年德國人制造了磁帶式錄音機。

隨著膠片、VCD、DVD的流行,聲音與視覺得到了統(tǒng)一,錄音+錄像也開始朝著數(shù)字化邁進。如果說影音播放是錄音文件對外展現(xiàn)的主要方式,那么如何將錄音文件導出為文字,則是另一個需要研究的問題。

通常意義上的錄音,只需對場景產(chǎn)生的外音進行錄制和存儲,對于產(chǎn)生的音源體、語言、發(fā)音角色等定向性選擇并不多,比如音源體是誰、用的是什么語言、參與的人員有哪些、需不需要同步翻譯等。

2005年,深度學習技術(shù)出現(xiàn),讓這些需求成為可能。深度學習是用計算機模擬人工神經(jīng)網(wǎng)絡,讓其逐漸“學會”各種任務,經(jīng)過訓練后的人工神經(jīng)網(wǎng)絡具備一定的人機交互能力,比如在幾種主要語言之間互相翻譯。

之后的發(fā)展主線比較清晰,大致可分為以下四個階段:

第一,技術(shù)完善階段(2005-2009年),在這個時期,人工智能主要是利用人工神經(jīng)網(wǎng)絡的自學習功能、聯(lián)想存儲功能和尋找優(yōu)化解能力來對機器學習進行改造,但未實現(xiàn)規(guī)模性的應用落地;

第二,應用試點階段(2009-2011年),主要實現(xiàn)了從理論、競賽,到軟件產(chǎn)品落地并集成應用。比如Alex Graves贏得了2009年ICDAR的3項關于連筆字辨識的比賽,蘋果語音助手Siri搭載到了iPhone 4S上。

2011年,Siri通過iPhone的交互界面,對用戶發(fā)出的語音進行識別,然后對手機操作做出自動回應,這標志著消費級智能終端首次出現(xiàn)搭載了語音識別技術(shù)的產(chǎn)品。

第三,應用落地階段(2011-2016年),一方面,各大智能終端廠商開始不同程度的集成語音助理;另一方面,錄音筆細分領域開始全面接入人工智能。

具體的兩個案例是,科大訊飛在2016年提出了一種基于深度全序列卷積神經(jīng)網(wǎng)絡的語音識別框架,在實現(xiàn)識別效果大幅提升的同時,解決了解碼時延高的問題。搜狗也推出語音交互引擎“知音”,意圖讓人機交互更加自然。

第四,規(guī)模商用、尋求場景突破階段(2016年-至今),隨著AI技術(shù)日漸成熟,智能錄音筆開始進入場景突破階段,在老樹上尋找新花是這個階段一眾玩家的商業(yè)邏輯的本源,也是思考點。

02

玩家紛爭升級

“智能手機已經(jīng)有很強的錄音功能了,為什么還要單獨購買錄音筆?”這是一眾智能錄音筆廠商亟需回答的首要問題。

這個問題其實很簡單,我們先從市場角度切入,根據(jù)前瞻研究院報告,我國智能錄音筆市場需求呈現(xiàn)快速增長,2019年我國錄音筆市場出貨量約為468萬臺,同比增長8.3%,市場規(guī)模達23.17億元,同比增長10.1%。

1

圖:2015-2019年中國錄音筆市場出貨量

業(yè)內(nèi)分析人士表示,“按照增速,未來兩三年對數(shù)碼錄音筆的存量替換、以及對智能錄音筆的增量需求,將進一步擴大智能錄音筆的市場規(guī)模。”言下之意,這個市場邏輯是被證明的,類似于手機拍照功能無法代替單反相機,手機的錄音功能同樣也無法完全代替錄音筆。

在日常工作學習中,我們需要同聲傳譯、語音轉(zhuǎn)文字功能,針對錄音過程中不同的錄音環(huán)境,需要有降噪功能,同時針對帶口音的普通話或方言,需要有高識別率,在互聯(lián)網(wǎng)時代,以備份和儲存為主的云服務功能也需要提供,且能支持在線編輯,而這些往往是智能手機所無法高質(zhì)量完成的動作。

如同智能手機解決功能機的痛點一樣,在市場的實踐中,除了上文提到的科大訊飛與搜狗,還有紐曼、愛國者、索尼、飛利浦等廠商,均不同程度將觸角伸到智能錄音筆領域。

總得來說,目前智能錄音筆領域玩家主要分為以下三個流派:

索尼和飛利浦是老派中的硬件玩家,他們是傳統(tǒng)錄音筆的頭部玩家,算是“老炮兒”。在聲學方面它們有著很強的技術(shù)積淀,比如索尼的隨身聽、MP3、CD機等都是其中翹楚,代表著一個時代。但他們所缺少的是互聯(lián)網(wǎng)基因,在人工智能時代,這些傳統(tǒng)巨頭自身的硬件優(yōu)勢還不足以彌補基因的缺失,在性價比上為用戶們所詬病。

紐曼和愛國者算是老派中的性價比玩家,也是國內(nèi)數(shù)碼界的份量級玩家。從數(shù)碼相機、MP3到手機,二者都有不同程度的介入,但市場份額一直欠佳,跨界進入錄音筆領域后,也缺少AI語音識別方面的技術(shù)沉淀,走的主要是性價比路線,靠低價博得市場。

科大訊飛和搜狗算是新派玩家,它們的打法有些相似,但也有差異化。

前者在智能語音與人工智能領域已有較多落地場景,其中車載端已經(jīng)發(fā)布到第四個版本,切入到智能錄音筆市場后,就開始了高中低端的全系開發(fā),目前已完成了初步布局;

后者的語音識別技術(shù)源于輸入法,緣由搜狗輸入法在PC端和手機端占有率一直不錯,在輸入習慣、輸入數(shù)據(jù)等方面有一定優(yōu)勢,到了移動互聯(lián)網(wǎng)時代,搜狗在硬件方面稍顯不足,智能錄音筆算是搜狗的試水之作,代表產(chǎn)品是C1/C1 Pro/C1 Max,具體表現(xiàn)還有待評估。

三類流派,各有千秋。但就趨勢而言,新派玩家已呈現(xiàn)趕超跡象。

03

場景成突圍關鍵

當我們在電商平臺搜索錄音筆時,發(fā)現(xiàn)列表基本都是智能錄音筆,這就意味著,錄音筆已經(jīng)完成了從數(shù)碼錄音筆到智能錄音筆的迭代。

2

事實也的確如此,自2016年以后,國內(nèi)智能錄音筆市場新品層出不窮,尤其是在2018年以后,大量新玩家涌入,甚至傳統(tǒng)手機廠商小米也通過生態(tài)鏈公司切入到市場。

問題是,在實際應用中,辦公、學習等強需求場景下,各家的解決方案大都趨于相同,很容易陷入同質(zhì)化窘境,如何在技術(shù)、設計、品牌以及場景上尋找差異化,便成了各家爭奪的要點。

以訊飛剛剛發(fā)布的腕式錄音筆R1和訊飛智能錄音筆SR302為例,兩者除了在拾音、轉(zhuǎn)寫、翻譯等技術(shù)功能上做了迭代升級,R1腕式設計代表著向年輕人的審美靠攏,功能上SR302能自動識別使用場景,智能選擇定向和全向兩種錄音模式。

這從某種程度上其實預示著智能錄音筆的行業(yè)風向變了,即如果說“平臺+賽道”是過去的商業(yè)打法大邏輯,那么現(xiàn)在玩家突圍的小邏輯在于對細分場景的感知和洞察,并完成精準需求匹配。

換句話說,未來的錄音筆將不再局限于錄音,而是一個集成生活與辦公的聚合物。比如,是否可以24小時監(jiān)測心率及睡眠,并配有消息提醒和鬧鐘等生活貼心功能,做到運動模式與錄音記錄的隨時切換,運動中途是否也可以隨時記錄靈感或其他關鍵信息。

可以想象的是,在新興的差異化競爭時代,在保證做深錄音筆精度的同時,如何拓展使用場景的寬度將是下一個角逐點。

編者按:本文轉(zhuǎn)載自微信公眾號:新眸(ID:xinmouls),作者: 凌石

本文來源新眸,內(nèi)容僅代表作者本人觀點,不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應用建議。(若存在內(nèi)容、版權(quán)或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p37 q0 我要投稿

分享:
標簽: 錄音筆 搜狗

品牌、內(nèi)容合作請點這里:尋求合作 ››

前瞻經(jīng)濟學人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領導者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領域解決方案,掃一掃關注。

前瞻數(shù)據(jù)庫
企查貓
作者 新眸
科技自媒體
205704
關注
247
文章
6
前瞻經(jīng)濟學人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學家互動交流讓您成為更懂趨勢的人

研究員周關注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學人APP下載二維碼

下載前瞻經(jīng)濟學人APP

關注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關注我們

我要投稿

×
J