您現在的位置是:首頁 > 籃球

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

  • 由 量子位 發表于 籃球
  • 2022-04-25
簡介目前,科大訊飛的中文語音轉寫準確率已經突破98%,英文達到95%

方言詞庫怎麼開啟使用

乾明 發自 世博中心

量子位 報道 | 公眾號 QbitAI

中國AI語音一哥怎麼看未來?

過去,演算法即壁壘,軟體即方案,AI語音缺精進但更缺場景。

現在,演算法無限接近極限,場景千樹萬樹梨花開,但如何真正讓AI之能觸達使用者?

科大訊飛的答案:終端硬體,而且是演算法定義的硬體。

這也是AI領域競爭愈發激烈的情況下,科大訊飛展現出的最新動向。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

在2019新品釋出會上,這家成立20年的AI公司,一口氣釋出5款硬體,並對其核心的語音作業系統進行了升級。

與往年不同的是,今年的新品釋出會上,硬體完全成為主角。

不僅有核心級產品翻譯機的3。0版本更新迭代,還新推出了智慧辦公本、轉寫機、智慧錄音筆、學習機等等應用到工作、生活和學習等場景中的產品。

此外,釋出會上,科大訊飛雲端語音作業系統iFLYOS進行了最佳化升級。在今年3月首次亮相的全球首個多語種AI虛擬主播也現身釋出會,作為串場,並用9種語言全程直播本次產品釋出會。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

一句話總結就是:圍繞語音技術高地,借硬體之手,以軟體為基,加速技術落地,覆蓋更多場景。

“借硬體之手”

新品釋出環節的大部分時間,都屬於面向C端銷售的硬體產品,也是科大訊飛近年來發展的重點。

根據科大訊飛2018年年報,2018年,科大To C業務實現營業收入 25。17 億,同比增長96。54%,在整體營收中佔接近1/3。

訊飛翻譯機3。0

率先登場的,是訊飛的核心產品翻譯機。截止到2018年底,翻譯機2。0的銷量已經超過30萬臺。科大訊飛表示,僅2018年,翻譯服務次數5億+次。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

現在,這一產品迭代到了3。0版本。與先前版本相比,線上翻譯可翻譯語言覆蓋全球近200個國家個地區,行業A。I。翻譯拓展到7個專業領域。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

3。0版本的翻譯機,支援普通話與粵語、東北話、河南話、四川話等方言之間的翻譯,還新增了維漢、藏漢等民族語言翻譯,翻譯速度也再度提升,達到“0。5秒閃譯”,並提升了影象拍照翻譯水平。

此外,離線引擎也有了新的升級,採用了新一代離線語音識別引擎、離線翻譯引擎,並內建了高通驍龍八核處理器。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

科大訊飛介紹,這些變化直接讓離線語音識別訓練模型規模擴大5倍,中英文識別率超95%;翻譯模型容量增加105%,涵蓋詞庫規模擴大1倍。

這款產品已經開售,價格3499元。與2。0版本相比貴了500元。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

訊飛轉寫機

緊跟著的是一款轉寫機產品。科大訊飛將其定位為“面向辦公場景的語音轉寫移動工作站”。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

最大的亮點,是內建離線解決方案,轉寫準確率能夠達到95%以上;並支援對講話人進行智慧分割槽、中英文同步展示、字幕實時疊加功能等等。

科大訊飛介紹稱,轉寫速度上,能夠“1小時講話,5分鐘出稿”。並支援中英文混合識別,藉助基於生成對抗網路的資料轉換演算法以及多解析度層次化建模演算法,中英混合識別效果從50%提升到85%+。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

面對專業的轉寫場景,這款裝置還有音影片同步採集功能,藉助“語音+影象”協同翻譯,能夠將專業名詞錯誤率下降50%。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

訊飛智慧錄音筆

緊接著,是智慧錄音筆產品,這是一款軟硬體一體化的裝置。同樣具備“1小時錄音,5分鐘出稿”的能力。訊飛介紹稱,藉助其研發的音轉文字引擎,轉寫識別準確率能夠達到98%。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

與大部分錄音筆不同,這款錄音筆還帶有獨立的觸控式螢幕,轉寫結果可以直接看到。並支援翻譯功能,而且,翻譯結果不僅能夠實時可見,也能夠實時可聽。

對於錄音的後期整理上,也有不少針對性的功能,能夠對重點快速進行標記,支援語音便捷搜尋,透過4G、WiFi方式連線網路,能夠實現錄音文字快速分享。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

續航能力是:滿電工作10小時。而且支援快充,充電5分鐘,錄音兩小時。

在這場釋出會上,科大訊飛一共推出了2款錄音筆裝置,分別是:

旗艦版SR 701,弧形陶瓷背板,3。5英寸觸控屏,內建32G記憶體和20G雲空間,售價2999元。

標準版SR501,機銑玻璃背板,3。1英寸觸控屏,內建16G記憶體和10G雲空間,售價1999元。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

訊飛智慧辦公本

接下來,是一款號稱“開啟筆記本的新時代”的硬體產品,科大訊飛稱其為智慧筆記本。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

這是一款墨水屏智慧硬體裝置,螢幕大小為10。3吋。核心的亮點是,能夠讓你在錄音轉寫的同時,也能夠手寫記錄要點。

手寫關鍵詞也可以做到字音同步,只要點選手寫的文字,就能播放手寫文字時的語音。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

後期的整理與檢索也內建了語音搜尋功能,有語音分析、自動標籤、內容關聯等自然語言處理能能力。

此外,作為一款墨水屏電子裝置,也支援電子書閱讀功能,也可以手寫郵件。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

現在,這款產品已經上線出售,售價4999元。

訊飛學習機

硬體環節最後登場的是一部學習機。這款裝置於今年4月首次亮相,與其他學習機相比,最大的不同點在於“智慧推薦針對學”。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

訊飛介紹稱,基於智學網隨機調研的400萬學生中35億條資料,他們發現學生60%的練習都是無效的。圍繞著這個方面,學習機主要有兩大功能:一是數理化精準學習提升效率,二是英語聽說讀寫綜合提升。

如何實現精準學習?基於知識圖譜系統, 科大訊飛將整個過程拆解成了三個步驟:

首先基於人工智慧技術快速測試,找到弱項;然後針對弱項進行精準學習;最後鞏固內化形成學習閉環。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

圍繞著英語聽說讀寫綜合提升方面,學習機中具備語音評測和語音轉寫功能。效果怎樣?訊飛說,藉助這款學習機,“不會英語的家長,也能檢查孩子背課文”。

此外,作為一款學習機,這款裝置還有名師影片、拍照搜題、同步練習、歷年真題試卷等等功能,也都內建其中,售價3999元。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

“以軟體為基”:iFLYOS 2。0

這場新品釋出會上,科大訊飛釋出了智慧物聯網作業系統iFLYOS的2。0版本,主講人為科大訊飛輪值總裁胡鬱。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

這一次在具體的功能上迭代與升級,主要集中在以下的幾個方面:

首先,新增了21種方言識別、語句中英文混合識別能力,並加入了全雙工能力支援使用者連續對話;

其次,深度集成了訊飛的麥克風陣列演算法,整合了AIUI語義能力,提供雲端芯一體化解決方案。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

第三,開放了多樣的處理模型,使用者可以定製技能以連線自己的服務;使用自己的使用者體系;並支援使用者級和裝置級的自定義喚醒詞,使用自己的發音人,把更多品牌元素結合到自己的產品內,打造屬於開發者自己的作業系統。

胡鬱介紹稱,現在的iFLYOS 2。0,已經內建了200+技能,有100+內容合作方,1500萬首正版音樂和1200萬小時的有聲內容。裝置方面,已經覆蓋4億智慧手機,3800萬車載裝置,1400萬智慧電視,以及500萬機器人玩具。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

他說,藉助iFLYOS 2。0平臺,原來需要6-12個月開發週期的智慧語音應用,現在只需要5天就可以完成了。

關於iFLYOS 2。0,科大訊飛一共提供了兩個版本。

一是基礎版,雲端支援語音合成、基礎語音識別、基礎語義理解、多場景模式、前後攔截器、技能工作室基礎版功能與基礎內容、基礎技能等服務。終端方面,支援拾音降噪、SDK、API和“藍小飛”語音喚醒。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

另外是專業版,除了基礎版所有功能之外,支援自定義賬號體系、麥克風陣列設計、面向專業領域的語音識別、晶片、PCBA、整機硬體參考設計等硬體方案,以及音樂、閒聊等其他收費內容。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

科大訊飛二十載,如何兌現AI價值紅利?

科大訊飛成立於1999年,至今已過二十載。從2008年A股上市以來,一直是中國人工智慧領域不可多得的AI商業化變現的代表。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

如何挖掘人工智慧價值?在這場大會上,一手創辦訊飛的劉慶峰給出了最新思考:

“AI唯有跨越技術鴻溝,才能真正兌現價值紅利。”

而訊飛,之所以能夠發展至此,正是跨越了多個技術鴻溝之後的結果。

劉慶峰登場之後,首先介紹的就是科大訊飛在過去一年內跨越的“鴻溝”:

語音合成:語音合成自然度(MOS分)達到4。0,即真人說話水平,業界唯一中、英文語音合成自然度達到並超過4。0分(普通人說話水平)的系統。

語音識別:語音識別準確率全面超過速記員。目前,科大訊飛的中文語音轉寫準確率已經突破98%,英文達到95%。

語音評測:在大規模考試評測中達到國家級測試員水平,業界唯一透過國家語委鑑定並大規模實用的技術成果。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

機器翻譯:系統透過CATTI全國翻譯專業資格(水平)測試,達到專業資格合格標準。

認知智慧:如“智醫助理”透過國家臨床執業醫師綜合筆試測試,讓醫生“核心能力”推廣成為可能。

這次科大訊飛釋出會上呈現出來的產品,基本都是圍繞著上述技術構建,也是其兌現價值紅利的載體。

在科大訊飛的董事長看來,2019年是人工智慧規模化應用落地元年,也將開始進入應用紅利兌現年。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

劉慶峰認為,判斷人工智慧技術價值兌換,有三個標準:

首先,要有真實可見的實際應用案例;

其次,能規模化應用的核心產品;

第三,能夠統計資料的應用成效。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

以教育領域為例。在他看來,基於人工智慧,可以讓每個孩子獲得更精準的教學,讓因材施教落到實處(實際應用案例)。

現在, 科大訊飛智慧教育產品和應用已經覆蓋25000多所中小學(規模化應用的產品)。

他們透露的成績單也頗為亮眼:學生學習效率提升50%,時間花費減少32%,焦慮情緒舒緩20%(應用成效)。

跨越AI技術鴻溝

此外,劉慶峰也給出了訊飛接下來將要跨越哪些“鴻溝”:多模態擬人互動、常識推理突破、通用人工智慧等等。

怎麼跨越?他介紹了三把鑰匙:

第一,演算法突破。面對小樣本、無監督、個性化問題的基礎理論持續突破;

第二,腦智同飛。腦科學研究和數學統計建模方法深度結合;

第三,人機耦合。人工智慧系統和人類行為協作的人機耦合方式持續探索。

其中,人機耦合是核心,劉慶峰也再次提出了“未來屬於人機耦合的新時代”的論斷。

0.5秒閃譯,12倍速轉寫,科大訊飛一口氣釋出五款超強AI產品

並以翻譯為例,進一步解釋了這一觀點:

雖然科大訊飛的機器口譯測試全球首次達到專業資格合格標準,但是這並不意味著機器可以替代人類同傳。

他說,人和機器的深度協作才是推動人工智慧應用真正落地的關鍵,這也是人工智慧時代社會倫理和人文發展的需要。

AI落地再探討

總之,作為中國AI語音的一哥,也是中國AI的最早探索者,科大訊飛給出了最新的思考和探索結果。

AI演算法的壁壘,訊飛一次次用國際競賽獎項突破證明。

AI硬體產品的壁壘,現在更多交給消費者。

他們找到場景,打造產品,用軟體定義硬體,創造更多AI落地場景,讓更多人透過終端產品體驗AI。

當然,這條路上,訊飛也不孤單。

越來越多AI公司認定這條路,越來越多AI技術被以產品化形態進入千家萬戶。

亞馬遜已經在AI音箱領域取得成功。

Google已經在“軟體+硬體+AI”戰略上初嘗勝果。

那麼開AI機器轉寫與翻譯之先的訊飛,現在一口氣推出5款AI硬體新品的訊飛呢?

規律和趨勢,會在這裡有怎樣的延續?

不妨拭目以待。

Top