您現在的位置是：首頁 > 垂釣

深耕音樂場景的語音助手，科大訊飛推出一款「發條」APP

由 36氪發表于垂釣
2021-09-27

簡介談到做發條的初衷，產品總監達達說，01年到現在，很多語音助手廠商轉型做智慧音箱等硬體，因為語音助手基於APP端的場景很侷限

訊語音引擎怎麼關

人工智慧語音行業如火如荼發展，語音助手、智慧音箱已不是新鮮事，各大廠商都在紛紛佈局。如果說通用型語音助手已經沒多少坑可佔，那麼垂直領域的細分應用場景是否還有機會可挖呢？

近期，36氪接觸到一款產品「發條」，為科大訊飛旗下創新產品，主打聽音樂這個細分領域。9月底上線後，在沒有推廣的情況下，使用者量已經達到4萬多。目前，產品可以在四種場景下使用：音樂、導航、微信、電話。開啟APP之後，預設是音樂場景，按下說話：邰肇玫墨綠的夜，即可開啟網易雲音樂自動播放：

科大訊飛在人機語音互動方向的嘗試由來已久。2012年，訊飛聯合中國移動做的靈犀語音助手，累計獲得過億使用者量，積累了豐富的語義底層資料。談到做發條的初衷，產品總監達達說，01年到現在，很多語音助手廠商轉型做智慧音箱等硬體，因為語音助手基於APP端的場景很侷限。現在大部分助手是為了查詢資訊，但是很少用手機做事兒。實際生活中，人們在說話時候，不一定是按照邏輯的，所以要讓機器理解也有難度。語音互動不夠開放的時候，語音助手做到擬人化很難。要實現突破，首先需要縮小到一個話術體系裡。訊飛團隊分析發現，使用者在語音助手上搜索音樂方面的資料佔比最高，因此決定聚焦在音樂這個場景。

AI終局是無限接近於人，但是離人的距離還很遠，需要基於場景，定點突破。在功能層面，發條透過語義處理引擎垂直在音樂場景，做到準確識別。比如使用者說晴天，產品會找相關歌曲，而不是報天氣。技術方面，使用訊飛的語音引擎技術，全雙工語音互動，整合語音喚醒（成功率達到95%）、語音識別、自然語言理解和語音合成。

在搜尋方面，發條透過與4家音樂平臺合作，採用AI搜尋引擎，實現全網搜歌，自動播放，並自動判斷版權歸屬。因各家音樂平臺分別持有不同音樂人和唱片公司的版權，發條在每一次使用者請求時，會向所有對接的音樂平臺發起請求，若使用者偏好APP內沒有對應曲目的版權，可自動跳轉至有版權的音樂APP進行播放，保證每一首歌、每一位歌手的內容都能讓使用者聽到。

關於後續的產品規劃，發條第一階段的目標是，做到更符合使用者直覺的說話響應，聽懂書面化、口語化的表達；再往後，將繼續做好音樂內容的優先識別模型和混合語種識別模型，最終實現個性化的識別和響應。

目前，發條團隊共有20多人，主要是產品和技術人員。談到未來發展，達達表示將會繼續做好面向使用者的APP，最佳化在音樂垂直領域的模型，同時把能力連線到耳機、音箱等硬體上，透過與廠商合作，逐步探索商業化。

36氪認為，語音助手與垂直場景的結合是智慧語音未來的發展方向。但是，如何選擇好場景，如果做到智慧化、生活化的理解，是擺在各個廠商面前的難題。音樂是最佳領域嗎？歡迎關注智慧語音助手行業的創業者、投資人與我們分享、交流觀點，36氪將持續關注這一領域。

上一篇：初養熱帶魚最好養些什麼品種？教你如何選購魚苗

下一篇：抒情·牡丹之歌國際詩歌·敢問路在何方

您現在的位置是：首頁 > 垂釣

深耕音樂場景的語音助手，科大訊飛推出一款「發條」APP

相關文章