您現在的位置是:首頁 > 垂釣

深耕音樂場景的語音助手,科大訊飛推出一款「發條」APP

  • 由 36氪 發表于 垂釣
  • 2021-09-27
簡介談到做發條的初衷,產品總監達達說,01年到現在,很多語音助手廠商轉型做智慧音箱等硬體,因為語音助手基於APP端的場景很侷限

訊語音引擎怎麼關

人工智慧語音行業如火如荼發展,語音助手、智慧音箱已不是新鮮事,各大廠商都在紛紛佈局。如果說通用型語音助手已經沒多少坑可佔,那麼垂直領域的細分應用場景是否還有機會可挖呢?

近期,36氪接觸到一款產品「發條」,為科大訊飛旗下創新產品,主打聽音樂這個細分領域。9月底上線後,在沒有推廣的情況下,使用者量已經達到4萬多。目前,產品可以在四種場景下使用: 音樂、導航、微信、電話。開啟APP之後,預設是音樂場景,按下說話:邰肇玫 墨綠的夜,即可開啟網易雲音樂自動播放:

深耕音樂場景的語音助手,科大訊飛推出一款「發條」APP

科大訊飛在人機語音互動方向的嘗試由來已久。2012年,訊飛聯合中國移動做的靈犀語音助手,累計獲得過億使用者量,積累了豐富的語義底層資料。談到做發條的初衷,產品總監達達說,01年到現在,很多語音助手廠商轉型做智慧音箱等硬體,因為語音助手基於APP端的場景很侷限。現在大部分助手是為了查詢資訊,但是很少用手機做事兒。實際生活中,人們在說話時候,不一定是按照邏輯的,所以要讓機器理解也有難度。語音互動不夠開放的時候,語音助手做到擬人化很難。要實現突破,首先需要縮小到一個話術體系裡。訊飛團隊分析發現,使用者在語音助手上搜索音樂方面的資料佔比最高,因此決定聚焦在音樂這個場景。

AI終局是無限接近於人,但是離人的距離還很遠,需要基於場景,定點突破。在功能層面,發條透過語義處理引擎垂直在音樂場景,做到準確識別。比如使用者說晴天,產品會找相關歌曲,而不是報天氣。技術方面,使用訊飛的語音引擎技術,全雙工語音互動,整合語音喚醒(成功率達到95%)、語音識別、自然語言理解和語音合成。

在搜尋方面,發條透過與4家音樂平臺合作,採用AI搜尋引擎,實現全網搜歌,自動播放,並自動判斷版權歸屬。因各家音樂平臺分別持有不同音樂人和唱片公司的版權,發條在每一次使用者請求時,會向所有對接的音樂平臺發起請求,若使用者偏好APP內沒有對應曲目的版權,可自動跳轉至有版權的音樂APP進行播放,保證每一首歌、每一位歌手的內容都能讓使用者聽到。

關於後續的產品規劃,發條第一階段的目標是,做到更符合使用者直覺的說話響應,聽懂書面化、口語化的表達;再往後,將繼續做好音樂內容的優先識別模型和混合語種識別模型,最終實現個性化的識別和響應。

目前,發條團隊共有20多人,主要是產品和技術人員。談到未來發展,達達表示將會繼續做好面向使用者的APP,最佳化在音樂垂直領域的模型,同時把能力連線到耳機、音箱等硬體上,透過與廠商合作,逐步探索商業化。

36氪認為,語音助手與垂直場景的結合是智慧語音未來的發展方向。但是,如何選擇好場景,如果做到智慧化、生活化的理解,是擺在各個廠商面前的難題。音樂是最佳領域嗎?歡迎關注智慧語音助手行業的創業者、投資人與我們分享、交流觀點,36氪將持續關注這一領域。

Top