您現在的位置是:首頁 > 垂釣

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

  • 由 量子位 發表于 垂釣
  • 2022-06-21
簡介作者在GitHub中介紹,他們希望反向詞典起到三種作用:解決話到嘴邊,卻忽然想不起來怎麼說的“舌尖現象”幫助新語言學習者幫助無法選擇單詞的失讀症患者這個反向詞典背後的核心AI,名為多通道逆向詞典模型,相關論文還中選過AAAI 2020

hair的中文是什麼意思

魚羊 發自 凹非寺

量子位 | 公眾號 QbitAI

奈何本人沒文化,一句(嗶——)行天下。

這位胖友,不知你行走江湖,是否也有過這樣的煩惱?

那麼這裡有個神器,可就值得好好說道說道了。

“聽我說謝謝你,因為有你,溫暖了四季”用成語應該怎麼說?

在搜尋框內輸入你想表達的意思,再在詞性一欄裡選擇成語,AI立馬就能給你丟擲幾十上百個選項。

背景顏色越深,代表系統推薦程度越高。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

要是碰上啥看不懂的,滑鼠一點,就能檢視具體釋義。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

還不只是中文,比如當你想脫口而出一句“鵝妹子嚶”,但又想知道有沒有更華麗的中文表達,同樣是一鍵即可得。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

怎麼樣,夠方便不?

是不是有點“媽媽再也不用擔心我詞窮”內味兒了(手動狗頭)。

來自清華的“反向詞典”

這個神器名叫

WantWords

反向詞典

背後的AI,來頭不小:誕生自清華大學自然語言處理與社會人文計算實驗室,專案指導教師為孫茂松教授和劉知遠副教授。

所謂“反向”,就是和常規詞典不同,不是按詞尋義,而是反過來給詞典一段描述,讓它來幫你找詞。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

作者在GitHub中介紹,他們希望反向詞典起到三種作用:

解決話到嘴邊,卻忽然想不起來怎麼說的“舌尖現象”

幫助新語言學習者

幫助無法選擇單詞的失讀症患者

這個反向詞典背後的核心AI,名為

多通道逆向詞典模型

,相關論文還中選過AAAI 2020。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

具體而言,多通道逆向詞典模型採用了雙向LSTM(BiLSTM)和注意力作為基本框架,並在其中加入了4個特定特徵預測器。

採用多個預測器來識別輸入查詢中目標詞的不同特徵,一方面,能使嵌入質量較差的目標詞透過特徵被挑選出來。

另一方面,也可以過濾掉與正確目標詞有接近嵌入、但存在矛盾特徵的詞。

也就是說,AI選詞能更精準。

而為了讓AI更容易找到真正“正確”的詞,除了詞性、詞素這兩個詞語的“內部特徵”外,作者還考慮了

層次體系

義原

這兩個“外部特徵”。

所謂層次體系,是用來區分一個詞是實體還是概念,實體下面又會分出各種各樣的實體。

義原在語言學中則是指最小的不可再分的語義單位。語言學家認為義原體系在任何語言中都適用,不與特定語言相關。

舉個例子,“男孩”這個詞可以由“人類”、“男性”、“兒童”這個三個義原表示,“女孩”則可以由“人類”、“女性”、“兒童”的組合來表達。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

△圖源:HowNet

新演算法已測試,相關新系統開發中

前文提到,WantWords反向詞典最早誕生於清華NLP實驗室,主要由豈凡超和張磊在2019年合作完成。

在與果殼交流時豈凡超談到,剛開始,他們並沒有對這個專案進行推廣,只是身邊的同學使用後反饋還不錯。

直到去年11月,這個專案突然火爆,一時之間訪問量暴增,把伺服器都給擠垮了。

自此之後,WantWords開始受到更多關注,也收穫了不少建議和來自志願者的技術支援。

不僅有了網頁版,微信小程式也已正式上線,還有APP版正在開發中。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

△微信小程式“WantWords”

根據研發團隊的最新公告,今年除夕之前,反向查詞還測試完成了新演算法,其效能相較於原有演算法有顯著提高。

而在反向詞典之外,研究團隊還開發“名言名句語義檢索及推薦系統”,以及“漢語詞語搭配查詢系統”。

快別「一句wòcào行天下」,清華搞了個神器專治詞窮

目前這兩個系統尚未對外開放,感興趣的小夥伴可以邊讀論文(文末奉上),邊蹲一波。

對了,研發團隊還表示,WantWords作為一個開源專案,隨時歡迎大家加入,參與設計&開發、提出需求、反饋問題。感興趣的話就去官網戳戳公告吧~

相關論文:

https://arxiv。org/abs/1912。08441

https://arxiv。org/abs/2202。13145

參考連結:

[1]官網:https://wantwords。net/

[2]果殼文章:https://mp。weixin。qq。com/s/er-JwST7dUQjMh6VzBE1bA

[3]https://deeplang。feishu。cn/docs/doccnoH9ncCZspo2Ubx79bpZ0Lh#ijyigh

Top