您現在的位置是:首頁 > 籃球

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

  • 由 智東西 發表于 籃球
  • 2022-03-18
簡介四、創新=藍海,訊飛消費者業務的三駕馬車從一支小小的錄音筆,到如今多了一塊螢幕與AI技術協同發展成一個新品類,在訊飛智慧錄音筆SR系列推出後的短短一年內,錄音筆市場經歷了翻天覆地的變化

轉zhuai怎麼組詞

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

智東西(公眾號:zhidxcom)

文 | 韋世瑋

智東西5月27日訊息,今日,科大訊飛針對其訊飛智慧錄音筆進行

錄音、轉寫和編輯三大效能升級,新增支援聲源定位、12種方言和10種語種轉寫、支援智慧摘要等13項功能,

進一步為使用者帶來更便捷高效的錄音體驗。

去年5月,科大訊飛一槍打在了傳統錄音筆市場創新賽道上,推出業內首款帶屏錄音筆——訊飛智慧錄音筆SR系列,直接催生了一個潛力不可小覷的新品類市場。

至今,SR系列已覆蓋媒體、商務、教育、律政等應用領域,

進入全球115個國家、646座城市的市場,

並拿下2019年雙11天貓&京東雙平臺錄音筆品類和單品銷售額第一的成績。

如今,隨著今年全國兩會如火如荼地召開,訊飛智慧錄音筆亦成為人民網、文匯報、齊魯晚報、21世紀經濟報道4家媒體記者團,報道兩會的指定錄音筆,協助記者等專業團隊提高報道效率,更好地記錄民聲民意。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

實現這一系列成果,

訊飛智慧錄音筆只花了一年。

在這背後,既是訊飛自2016年成立消費者事業群以來,在To C市場不斷摸索和佈局,也是訊飛智慧語音技術21年來的技術積累,在轉寫賽道上不斷研發創新。

在這個千萬級規模的錄音筆市場下,訊飛哪來的信心和底氣選擇以帶屏錄音筆殺入這個幾乎飽和,卻玩家擁擠的市場?自敲開錄音筆新品類市場後,訊飛在過去一年又取得了哪些重要的成績?市場又發生了哪些變化?

為此,智東西再度獨家對話科大訊飛聯合創始人&執行總裁胡鬱、科大訊飛副總裁兼消費者事業群副總裁李傳剛,在直擊訊飛三大重磅升級的同時,進一步揭開這些答案的真實面紗。

一、三大升級亮點:支援超20種語言語種,遠端拾音準確率提升30%

“作為AI錄音筆的龍頭廠商,我們應該儘快讓使用者體驗到AI技術與錄音筆融合的真正效果。”胡鬱談到,在過去一年,訊飛不斷地對錄音筆AI效能進行最佳化和升級,選擇在今天進行重要的三大升級,也是為了讓原有的錄音筆使用者率先體驗更新穎的智慧化功能。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

▲科大訊飛聯合創始人&執行總裁胡鬱

此次,訊飛智慧錄音筆主要

圍繞智慧錄音、語音轉寫和智慧編輯三個方面,進行13項重要升級,包括聲源定位、方言轉寫、語義分段、個人詞庫等功能。

1、智慧錄音:360度聲源定位,準確率提升30%

針對錄音的專業性,訊飛智慧錄音筆新增了錄音聲源定位、非人聲過濾和高增益降噪三項功能。

一是聲源定位,錄音筆能夠透過判斷聲源方位,實現更好的拾音效果;二是非人聲過濾,其與AI演算法相配合,可將錄音中空白或嘈雜等無用聲去掉,保留有用人聲;三是高增益降噪,在5至15米的錄音範圍內,轉寫準確率提升30%,人聲也更加清晰。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

▲科大訊飛副總裁兼消費者事業群副總裁李傳剛

2、語音轉寫:支援22種語言+語種,7大專業領域轉寫

這方面升級中的最大亮點在於新增了粵語、河南話、雲南話和重慶話等12種方言轉寫,維吾爾語和藏語兩種少數民族語言轉寫,以及西班牙語、越南語、俄語、英語、日語和韓語等8種語種轉寫,進一步擴大錄音筆的語言應用場景。

同時,針對不同領域的專業術語轉寫,訊飛還更新了7大專業領域的轉寫支援,覆蓋IT科技、財經貿易、文化體育、醫療、政法、運營商和教育領域。同時,還新增中英文混合轉寫功能功能。

3、智慧編輯:個性化詞庫,文字編輯更清晰

面對不同錄音場景、多個說話人和口語表達習慣,訊飛在智慧編輯方面新增了智慧語義分段、自動區分講話人、口語規整、個人詞庫和智慧摘要5項功能,讓錄音筆能更智慧地進行文字編輯。

例如,在區分講話人方面,錄音筆採用了訊飛的聲紋識別技術,能根據錄音及轉寫結果,自動區分並標註講話人。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

“這次三大方面的功能升級,不僅能更加滿足消費者的需求和體驗,也更利於我們對市場的開拓和認知。”李傳剛說。

三大升級之於訊飛智慧錄音筆,不僅是對產品效能和體驗的進一步豐富完善,提升訊飛在錄音筆新品類市場的優勢和競爭力,同時它之於錄音筆之上的訊飛消費者事業群,亦為其深入佈局AI+辦公這一細分市場提供了新的技術儲備和解決方案。

“拳頭”升級,訊飛打響的帶屏智慧錄音筆新戰局再度升溫。

二、21年深耕與積累,訊飛智慧語音技術的硬核力量

羅馬並非一日建成。訊飛智慧錄音筆能在短時間內站穩市場,並佔據一定身位的領先優勢,是其

長達21年的智慧語音技術迭代和積累。

“過去幾年,我們的智慧語音技術曾經歷了三次較大的革新與升級。”胡鬱提到,這主要集中在語音識別、方言識別,以及多語種的錄音轉寫、翻譯上,而這些技術性能亦是訊飛大舉進攻細分市場的差異化競爭點。

在語音識別領域,訊飛語音識別模組採用了基於深度全序列卷積神經網路的語音識別框架,識別準確率達98%,同時還透過多麥克風陣列去混響和多麥克風波束成形,進一步提升信噪比。如今,其麥克風陣列與錄音筆回傳的資料進行疊加後,能夠在幾十米的範圍內獲得更好的拾音效果。

在多語言識別領域,不管是中國方言的識別,還是全球多語種的錄音轉寫和翻譯,訊飛都下足了功夫。

簡單地說,針對方言識別,訊飛採用統一的建模技術,透過少量的方言資料,進一步提升錄音筆在方言語境場景的錄音效果;另一方面,訊飛透過語音識別技術的不斷研發和最佳化,將多語種的轉寫和翻譯效能效果都實現了提升。

尤其在多語言識別方面,胡鬱透露,目前中國科學院專門支援中國科學技術大學開展了一項多語識別先導專案,

目標研發超過50個語種以上的核心技術,涉及語音識別、語音合成以及自然語言處理等技術。

“這是目前國內投資規模最大的多語種研發專案,現階段還沒有任何一家公司有這樣的資源和能力,對這種規模的多語種系統進行研發。”胡鬱談到,這將進一步促進訊飛在多語言技術領域的研究。

如今,訊飛智慧錄音筆的研發團隊已突破百人規模,包括硬體、軟體、UI互動等均由訊飛的核心研發力量設計。

值得一提的是,隨著訊飛在智慧語音領域長達21年的佈局和深耕,已打下了堅實的技術根基,技術儲備力量不斷豐富。

其中以語音識別技術為例,早在2016年,訊飛就已在國際多通道語音分離和識別大賽CHiME-4中,一鼓作氣拿下了三個專案第一。在2020年CHiME-6上,訊飛不僅在給定說話人邊界的多通道語音識別任務中奪冠,更重新整理了自己在CHiME-5中的語音識別錯誤率記錄,從46。1%降至30。5%。

這二十餘年的技術成果與積累,無疑為訊飛敲開錄音筆市場新品類的大門,帶來了十足的信心與底氣。

三、打響帶屏錄音筆市場第一槍,技術融合下的小爆發

一面是人工智慧不斷賦能各行各業的技術浪潮,一面是當下傳統錄音筆和錄音技術的轉寫痛點,訊飛澆灌了21年的智慧語音技術,終於在帶屏錄音筆這塊新市場中破了土,發了芽。

訊飛入局錄音筆市場的第一槍,為何瞄準了帶屏錄音筆?

“加入訊飛前我就在想,AI作為未來的一個技術發展方向,除了在手機、智慧穿戴裝置和智慧音箱等智慧硬體方面賦能,還能在哪裡找到突破口?”李傳剛談到,作為北大MBA的導師,他經常到北大與學生們進行案例討論,當時他發現,學生幾乎人手備有一個傳統錄音筆,主要用在對知識的記錄與鞏固上。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

但問題是,他們常常需要自己再花時間重複聽一遍錄音,才能將內容記錄下來。這一大量的時間和人力成本,讓李傳剛抓到了新的突破口——傳統錄音筆與AI的技術融合。

在與胡鬱進行了一番溝通後,李傳剛發現訊飛也正在考慮這一方向,兩人一拍即合。經歷將近半年的硬體研發與打磨,2019年5月,訊飛智慧錄音筆SR系列終於面世。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

一石激起千層浪,SR系列的推出直接點燃了傳統錄音筆市場的熱情。

一方面,訊飛智慧錄音筆SR系列一上市,就在2019年京東“618”中獲得錄音筆品類成交金額第一的成績,目前已進駐全國超2000家線下門店;另一方面,現階段SR系列也已拓展至國際市場,進入全球115個國家,646個城市中銷售。

“訊飛智慧錄音筆SR系列最大的創新性並不在於帶屏,而在於將它是一個獨立的智慧錄音裝置。”在胡鬱看來,在不同的場合下,使用者對錄音筆的心理依賴程度不同。

一個單獨的錄音筆,並不會像手機錄音軟體一樣受到各種干擾,它能持續獨立地使用,同時又能透過統一的賬號在手機和PC上進行後臺處理。基於後臺操作的需求,才進而衍生出大屏的需求,讓使用者的操作更加便捷。“一個獨立的能夠進行智慧轉寫的裝置,這才是它的顛覆性所在。”胡鬱說。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

隨著訊飛智慧錄音筆SR系列的推出,訊飛消費者事業部的智慧硬體產品線得到了很大的豐富。除了SR系列智慧錄音筆外,訊飛聽見系列也正逐步朝更大的市場邁進,同時與錄音轉寫相關的硬體裝置也在預期中迅速增長。

在此影響下,訊飛的AI廣告和內容服務業務,以及與政府、國企之間的業務也在加速發展。據科大訊飛2019年財報,在2019年度,訊飛的營收首次突破100億人民幣,達到100。79億元,同比增長27。30%。其中,消費者業務營收36。25億人民幣,同比增長43。99%,佔總營收比進一步攀升至35。96%。

To B+To C的雙線戰略驅動下,訊飛正加速發展。

四、創新=藍海,訊飛消費者業務的三駕馬車

從一支小小的錄音筆,到如今多了一塊螢幕與AI技術協同發展成一個新品類,在訊飛智慧錄音筆SR系列推出後的短短一年內,錄音筆市場經歷了翻天覆地的變化。

“對於整個錄音筆市場來說,我們開啟的並不是一個存量市場,而是一個新的增量市場。”李傳剛說。

一面是整個行業在思考錄音筆市場的未來走向,不斷解決消費者的多樣化轉寫需求;一面是傳統玩家與新玩家攜手,共同建立產業聯盟,以加速推進包括轉寫技術、智慧語音識別技術在傳統錄音筆中的融合發展。

隨著玩家的不斷轉型和創新發展,又將會給訊飛帶來哪些挑戰?

“整體上看,更多玩家的加入我覺的是一件好事。”胡鬱談到,由於現在從傳統錄音筆向智慧錄音筆轉換的過程中,最大的障礙仍然是使用者教育——如何讓使用者意識到使用智慧錄音筆更有價值。

儘管訊飛開拓了新的錄音筆品類市場,但縱觀整個產業的發展,它仍是一個螺旋式上升的過程,智慧化發展也將是這一產業逐漸演變的方向。在這一過程中,既要靠消費者消費習慣的轉變,也需要靠傳統錄音筆廠商自身的轉型推動。

“不管有多少玩家加入,訊飛在這市場中仍是一個龍頭地位。”胡鬱說,訊飛非常有信心在這個市場中持續保持自己的領先優勢,這一信心也來自於訊飛所提供的多樣性服務,例如面向政府部門的會議寶,以及涉及面向教育、商務和律政等應用場景下的智慧硬體產品。

12種方言秒轉文字!用一支錄音筆撬動的AI革命,科大訊飛贏在哪?

據產業研究機構新思界最新發布的《2019-2023年錄音筆行業深度市場調研及投資策略建議報告》,2018年,我國錄音筆行業的產量約為452。12萬臺,出貨量與2017年的431。97萬臺基本持平。

整體來看,我國錄音筆市場出貨量較為穩定,市場規模仍較小。那麼,在這之下的AI+錄音筆市場又將如何發展呢?

“創新永遠是藍海。”李傳剛談到,傳統錄音筆市場的需求在過去二、三十年並未產生太大變化,但隨著AI技術的賦能,錄音筆除了錄音之外,還將具有智慧轉寫、智慧翻譯和智慧編輯等更多功能,市場規模也將進一步擴大,激發出更多原有錄音技術不足而未開發的市場。

市場仍在潛滋暗長,

科大訊飛的下一步在哪裡?

縱觀訊飛的消費者事業群,胡鬱談到,訊飛將持續以平臺(iFLYOS作業系統)、硬體(智慧硬體)、服務(廣告和運營商網際網路服務)為發展重心,進一步拉動“AI+翻譯”、“AI+辦公”、“AI+教育”三駕馬車同時往前走。

往後看,是訊飛在智慧語音領域長達21年的技術基因和積累;往前看,是訊飛在AI技術熱潮下敢於嘗試技術跨界與融合創新的信心和勇氣。

結語:以AI為刃,傳統錄音筆市場的創新與變革

回顧智慧錄音筆市場過去一年的發展,科大訊飛按下的,不僅是自身消費者業務加速佈局智慧市場的“快進鍵”,也是錄音筆行業與AI技術跨界融合下催生新市場的“啟動鍵”。在這一節點下,訊飛智慧錄音筆三大技術的升級,也將為公司以及市場競爭的發展新增新的差異化競爭優勢。

談及智慧錄音筆的未來,胡鬱認為將有兩條路,一是與手機APP等結合,朝著極簡的方向發展,二是向更高階、更專業的定製化獨立裝置前進。這條路究竟走向何方,我們尚不得而知。

但我們能看到的是,在當下傳統錄音筆結合新興技術的轉型下,有越來越多的玩家投入這片藍海市場,他們單打獨鬥也好,互相結盟也罷,同一個目標無疑都是搶下這塊蛋糕。在這場愈發激烈的長跑賽道上,最終誰將真正拔得頭籌?我們拭目以待。

Top