機器之心報道
編輯:杜偉、小舟
在第 15 屆 ACM 國際網際網路搜尋與資料探勘大會(WSDM 2022)上,來自清華、人大和中科院計算所的研究者獲得了最佳論文獎,時間檢驗獎花落推薦系統。
2 月 21 日至 25 日,第 15 屆 ACM 國際網際網路搜尋與資料探勘大會(The 15th International Conference on Web Search and Data Mining,WSDM 2022)在線上召開。
作為資料庫 / 資料探勘類的主要會議之一,WSDM 是由 ACM 所屬的資訊檢索(SIGIR)、資料探勘(SIGKDD)、資料庫(SIGMOD)和網路資訊處理(SIGWEB)四個專委會協調籌辦。該會議主要發表與網路或社交網路搜尋和資料探勘相關的高質量原創論文,重點關注實用的搜尋和資料探勘新模型、演算法設計和分析、經濟影響以及對準確率和效能的深入實驗分析。
本屆 WSDM 會議共接收了 790 篇長文投稿,最終錄用了 160 篇,錄用率約為 20%。近日,WSDM 2022 公佈了最佳論文獎和最佳論文獎亞軍,其中來自清華、人大和中科院計算所的研究者獲得了大會唯一的最佳論文獎。
最佳論文獎
WSDM 2022 的最佳論文獎首次授予了清華大學、人大、中科院計算所等中國科研機構研究者合作完成的論文《Learning Discrete Representations via Constrained Clustering for Effective and Efficient Dense Retrieval》。
- 論文地址:https://arxiv.org/pdf/2110.05789.pdf
- 作者及機構:詹靖濤(Jingtao Zhan,清華大學)、毛佳昕(Jiaxin Mao,中國人民大學)、劉奕群(Yiqun Liu,清華大學)、郭嘉豐(Jiafeng Guo,中科院計算技術研究所)、張敏(Min Zhang,清華大學)、馬少平(Shaoping Ma,清華大學)
密集檢索(DR)已經實現了 SOTA 排序效果。然而,大多數現有 DR 模型的效率受到一些限制,特別是儲存密集向量需要大量記憶體成本,並且在向量空間中做最近鄰搜尋(NNS)非常耗時。因此,該研究提出了一種新型檢索模型 RepCONC,透過約束聚類(CONstrained Clustering)學習離散表徵。
RepCONC 聯合訓練雙編碼器和乘積量化(PQ)方法來學習離散文件表徵,並實現具有緊湊索引的快速近似 NNS。它將量化建模為一個受約束的聚類過程,這要求文件嵌入圍繞量化質心均勻聚類,並支援量化方法和雙編碼器的端到端最佳化。
該研究從理論上證明了 RepCONC 中均勻聚類約束的重要性,並透過將其簡化為最優傳輸問題的一個例項,為約束聚類匯出了一個有效的近似解。除了約束聚類,RepCONC 進一步採用基於向量的倒排檔案系統 (IVF) 來支援 CPU 上的高效向量搜尋。對兩個流行的 ad-hoc 檢索基準進行的大量實驗表明,在多種壓縮比設定下,RepCONC 比其他向量量化基準實現了更好的排序效果,它在檢索效率、記憶效率和時間效率方面也大大優於現有的各種檢索模型。
最佳論文獎亞軍
WSDM 2022 共有 3 篇論文獲得最佳論文獎亞軍,分別如下
論文 1:Doubly Robust Off-Policy Evaluation for Ranking Policies under the Cascade Behavior Model
- 論文地址:https://arxiv.org/pdf/2202.01562.pdf
- 作者及機構:Haruka Kiyohara(東京工業大學)、Yuta Saito(康奈爾大學)、Tatsuya Matsuhiro(雅虎日本公司)、Nobuyuki Shimizu(耶魯大學)、Nobuyuki Shimizu(雅虎日本公司)、Yasuo Yamamoto(雅虎日本公司)
論文 2:Evaluating Mixed-initiative Conversational Search Systems via User Simulation
- 論文地址:https://dl.acm.org/doi/10.1145/3488560.3498440
- 作者及機構:Ivan Sekulic(USI,盧加諾大學)、Mohammad Aliannejadi(阿姆斯特丹大學)、Fabio Crestani(USI)
論文 3:The Datasets Dilemma: How Much Do We Really Know About Recommendation Datasets?
- 論文地址:https://dl.acm.org/doi/10.1145/3488560.3498519
- 作者及機構:Jin Yao Chin(南洋理工大學)、Yile Chen(南洋理工大學)、Gao Cong(南洋理工大學)
時間檢驗獎
本屆會議的時間檢驗獎(Test of Time Award)授予了在 WSDM 2011 上發表的論文《Recommender Systems with Social Regularization》。
- 論文地址:https://dennyzhou.github.io/papers/RSR.pdf
- 作者:Hao Ma、Dengyong Zhou、Chao Liu、Michael R. Lyu、Irwin King
- 機構:香港中文大學、微軟研究院
評獎委員會評語:
推薦系統已被證明是學界和業界的一個經久不衰的研究課題。2011 年關於推薦系統的這篇論文因其重要性以及對社群的影響而被評獎委員會授予時間檢驗獎。該論文著眼於信任和推薦之間的深層關係,認識到使用者不一定與他們信任的每個人都有相似的品味,但這種信任對於推薦至關重要。研究者透過為不同的推薦任務確定最合適的社交關係,有助於確立將社交資訊納入推薦系統的價值。因此,這篇論文具有很高的影響力,並在 WSDM 時間檢驗獎的所有提名論文中被引用次數最多。同時,論文也顯示了對推薦中信任和透明度的重要性的遠見,這已成為最近的一個重要課題。
完整接收論文列表:https://www.wsdm-conference.org/2022/accepted-papers/
參考連結:https://www.wsdm-conference.org/2022/