您現在的位置是:首頁 > 籃球

揭秘!資訊檢索技術高階玩法

  • 由 阿里云云棲號 發表于 籃球
  • 2021-08-19
簡介《SIGIR 頂會論文解讀》重磅釋出由 7 位阿里巴巴技術專家精心打造,內容覆蓋推薦系統 、成交轉化模型 、 迴音室效應 、 全空間多工轉化率預估建模 、 DeepMatch 召回模型 、 跨領域冷啟動使用者推薦網路 、 表示學習模型等資訊

片語檢索技術是什麼

《SIGIR 頂會論文解讀》重磅釋出

由 7 位阿里巴巴技術專家精心打造,內容覆蓋推薦系統 、成交轉化模型 、 迴音室效應 、 全空間多工轉化率預估建模 、 DeepMatch 召回模型 、 跨領域冷啟動使用者推薦網路 、 表示學習模型等資訊檢索領域新技術。

揭秘!資訊檢索技術高階玩法

精彩內容搶先看

揭秘!資訊檢索技術高階玩法

1、對抗推薦系統

回顧推薦系統的發展,離不開模型、資料、訓練方式三個維度的創新。模型層面,基於內容的推薦系統到協同過濾的矩陣分解,以及神經網路帶來的序列化建模,使得使用者表徵和商品表徵刻畫越來越精細;資料層面,長短期行為的切分,基於session 的推薦 [1],跨場景行為的引入,資料的豐富和建模為使用者興趣的挖掘提供更多的可能;訓練方式上,分散式訓練框架,線上學習,高維稀疏特徵處理,最佳化器設計,從而支撐商業化推薦系統。然而,效能提升的同時,我們也看到推薦系統的可解釋性逐漸變成黑盒。使用者的興趣偏好如何表徵,興趣如何演變,不同時間點的歷史行為由哪種因素主導,這一系列的問題都對現代化推薦系統的解釋提出了挑戰。

2、GMCM基於微觀行為圖的成交轉化模型

電商推薦系統幫助使用者尋找感興趣的商品。在這個系統中,兩個任務扮演了至關重要的角色,點選率預估(CTR Estimation)和成交轉化率預估(CVREstimation)。顧名思義,點選率是商品從被曝光到被點選的機率,成交轉換率是商品從被點選到被購買的機率。

雖然學界和業界在 CVR預估方面做了不少有意義的工作,但是工業應用中的 CVR預估仍然是個有挑戰性的任務。

3、屬性二部圖的表示學習

網路資料是一種常見的資料表示形式,可以用來建模現實世界中的多種應用場景。網路表示學習(又稱作圖嵌入學習),作為一種建模網路資料的模型,近年來受到學界和工業界的廣泛重視,得到了極大發展。網路表示學習旨在把複雜的網路圖資料結構嵌入到低維的連續向量空間中,並且使每一個節點的特徵資訊在低維空間中得到反饋。近年來,大量的網路表示學習方法和模型被不斷提出並且在鏈路預測、節點分類、網路視覺化等相關的實際任務上有很好的表現指標。

4、瞭解電子商務中的迴音室效應

個性化推薦系統在為使用者帶來更精準商品的同時,也對消費者的興趣偏好和行為造成影響,例如迴音室效應。迴音室是指使用者不斷接受相似的資訊和內容, 從而使得他們的興趣或者態度被不斷強化。這種現實通常出現在社交媒體和網路平臺,也同樣可能出現在電子商務等推薦系統中。我們的研究集中在電子商務的推薦系統對使用者興趣的影響,利用淘寶的大規模使用者資料檢驗是否存在迴音室效應。

5、基於post-click行為分解的全空間多工轉化率預估建模

隨著移動網際網路的興起,從海量的資料中挖掘出有價值的資訊並呈現給使用者,已成了電商、社交、新聞等主流應用的核心功能,推薦系統正是在這樣的背景下誕生的。在電商領域,高質量的推薦系統能為使用者提供精準、及時、甚至帶有一定驚喜性的個性化服務,進而有效地增加了使用者與系統之間的黏性,同時也能為平臺帶來一定的收入。一般說來,電商領域 ( 如淘寶 ) 的推薦系統架構主要包括兩個階段:系統決策和使用者決策。

6、一種挖掘使用者評論文字的跨領域冷啟動使用者推薦網路

在大型推薦場景中,存在著眾多類目(例如亞馬遜平臺中的書籍、影視推薦等)。使用者往往只與其中部分類目有過互動,對於其他類目,由於缺少相應的歷史行為記錄,協同過濾方法會遭遇冷啟動問題。

為了緩解冷啟動問題,一類可行的方法為利用使用者在其他類目上的歷史互動記錄進行知識遷移(跨領域推薦),比如,給喜歡武俠小說的使用者推薦古裝電影。同時,為了更細緻地刻畫使用者形象,參考使用者的歷史評論進行輔助推薦也能起到促進作用。

近年來,跨領域推薦和基於評論的個性化推薦均取得了不俗的進展,卻鮮有工作將二者結合。這類工作主要存在以下挑戰:

1)使用者在不同類目下的關注點是不同的,且只有少量稀疏特性存在關聯,導致模型較難發現此類隱式關聯;

2)對於在當前類目下無歷史記錄的冷啟動使用者,若直接利用其他類目下該使用者的評論文字,則會不可避免地帶來使用者特徵的抽取誤差,例如,喜歡粗糙質地工藝品的使用者,不一定會喜歡粗糙材質的衣物。鑑別不同類目間評論文字的語義差異,也是一個不小的挑戰。

針對以上問題,本文提出了一種挖掘使用者在不同類目下的評論關聯,進而對冷啟動使用者進行推薦的深度模型,稱作CATN

7、全域性自適應模組:為召回模型裝上第三隻眼

DeepMatch在搜尋、推薦和廣告等系統都大量應用,是一種重要的召回方式。通常將使用者 ( 搜尋場景下包含 Query) 和商品透過深度模型編碼成向量,線上透過向量近鄰查詢 top K 個商品作為召回結果。

Top