精確實現城市中異常事件的預測,在智慧城市中智慧交通以及城市公共安全的應用中起著重要的作用。為實現該目的,我們的研究工作從以下兩個重要層面對時空資料進行建模: 1)學習異常事件在時間維度上的動態和高階屬性;2)不同維度資料模型(時間,空間以及語義維度)的互動的特性。在該論文中,我們提出了一種基於互動注意力機制的時空資料預測模型,透過異構注意力模組的協同作用,我們可以實現對城市異常事件在不同維度上的呈現出來的不同資料模式的自動學習。透過在實際時空資料上的實驗測試,我們所提出的新演算法相較於現在的演算法呈現出更有的預測效果。
AI TIME 特別邀請了香港大學計算機學院助理教授,博士生導師——黃超,給大家帶來分享《推薦系統中的異構關係學習》。
黃超:博士畢業於美國聖母大學,香港大學計算機學院助理教授,博士生導師。目前主要的研究方向主要為人工智慧,資料探勘,時空資料分析,推薦系統。在KDD, WWW, AAAI, IJCAI, SIGIR, CIKM, WSDM等資料探勘和人工智慧領域頂級會議發表論文30餘篇。其中計算機學會A類14篇。以第一作者發表的論文曾獲得WWW’2019最佳論文提名。與此同時,擔任了KDD, WWW, AAAI, IJCAI, SIGIR, WSDM, CIKM, ICLR等會議的評審委員會委員,以及TKDE, TOIS, TIST, TOC, TKDD, TNNLS等期刊的長期審稿人。並且被WSDM’2020會議授予優秀評審獎。
推薦系統在當下應用的十分廣泛。無論是當下的國民級app—抖音,還是我們平時常用的一些電商平臺,都可以見到推薦系統的身影。推薦系統現在基本上是作為一個線上的使用者建模平臺中的一個關鍵技術。
我們今天介紹的主要是推薦系統中的異構關係。舉個例子,使用者側我們在線上電商平臺購物的時候都會遇到一些社交關係,這樣我們在做決策的時候多少也會受到這些好友的影響。
在商品側,知識圖譜所包含的商品語義資訊也是一個很關鍵的刻畫。
在使用者與商品的互動層面,我們會把喜歡的商品新增到收藏列表,我們也會把覺得ok的商品放到購物車,這樣說明使用者與商品的互動層面也是存在異構關係的。
綜上說明,異構關係是普遍存在的。我們希望在推薦系統中無論是對錶徵的學習,還是使用者興趣的學習,都進行一個joint learning。
使用者維度的社交關係social relationship也是會影響到使用者決策的。
而在商品維度,我們會對商品的語義資訊進行建模。可能是同屬一個類別,我們基於這些各式各樣的資訊,可以建立一個商品基於這種關係的圖,然後如何在這個圖上學習並建立一個使用者和商品融合的關鍵點是我們接下來要重點關注的。
我們接下來主要做的就是探索如何在使用者和商品之間的互動中進行joint learning。
今日架構介紹,主要有兩種架構:
(1)Graph Convolutional Network-based Models(GCN).
受圖譜學習框架-圖卷積網路(GCN)的啟發,一些研究透過在社交網路上遞迴傳播資訊來模擬使用者之間的影響過程,以細化使用者和物品表示。
(2)Graph Attention Network-based Moddels(GAT).
為了區分鄰域特徵聚合的重要性,提出了一種利用節點空間資訊嵌入傳播的非譜學習方法——圖注意網路(GAT)
一、現有方法
缺少對於使用者和商品兩個維度的sign information 去joint learning的方式,所以希望可以透過對異構關係的學習加強對推薦系統的學習。
我們採用以下三圖作為我們方法的input:
然後用這個使用者的社交資訊和商品的知識圖譜資訊作為額外的異構關係資訊,我們希望能夠預測使用者是否決定去點選或購買某個商品。我們將這個整體方法定義為一個coorative的異構圖資訊。
在這個場景中,我們需要考慮該如何提取資訊,從以下5個方面:
當前GCN作為推薦系統裡比較普遍的一個模型,然後我們用GCN對整個graph進行encoding。對於使用者和商品,我們都得到了相應的表徵資訊。之所以用GCN,主要考慮到就是快,GAT可能每次傳遞訊息都要計算attentino,會帶來更大開銷。
針對我們有的這5個graph,我們在這裡是從使用者維度和商品維度進行綜合學習。最終的出對於使用者和商品都學到了一個attention來代表5個graph的每一個語義。
當前GCN作為推薦系統裡比較普遍的一個模型,然後我們用GCN對整個graph進行encoding。對於使用者和商品,我們都得到了相應的表徵資訊。之所以用GCN,主要考慮到就是快,GAT可能每次傳遞訊息都要計算attentino,會帶來更大開銷。
針對我們有的這5個graph,我們在這裡是從使用者維度和商品維度進行綜合學習。最終的出對於使用者和商品都學到了一個attention來代表5個graph的每一個語義。
這裡我們用到的主要是一種基於自監督的方式,自監督可以分為generative和contrastatic兩種方式,目的是在整個的推薦系統場景下有些資料較為稀疏甚至有噪聲。自監督是希望可以額外引進一個學習的任務,來對推薦系統裡的模型增強。既然我們考慮到了這個因素,所以我們希望可以在使用者和商品之間注入一個高階資訊。
使用者本身有一個local level的一個embedding,還有他們的social graph,這裡我們會去學一個 graph embedding。最終我們會進行互資訊的計算,透過額外的任務——判斷這個node是否屬於這個sub-graph。透過引入整體的自監督任務,就可以學到模型中使用者本身的高階資訊。
這個模型等於是學習到了使用者local interaction的方式,同時也考慮到了高階資訊。
以上就是同時考慮到使用者的社交資訊和商品的知識圖譜,這兩個維度共同來對整個使用者的表徵學習進行增強。
二、模型實驗結果:對比多類推薦系統
第一個要對比的就是社交推薦的模式
第二個商品之間對比的是對於知識圖譜增強的推薦系統演算法
我們主要的關注點是對異構關係的學習,我們拿現有的異構圖網路相關方法作為baseline,考慮到5個維度,對比實驗結果如下:
每一個方面的relation對於整體的增強都起到來正面效果,說明不同的異構關係對於整個推薦系統都是有促進作用的。
除了從使用者和商品兩個維度進行研究工作之外,還有研究使用者與商品之間的多互動行為。
使用者的多種行為是廣泛存在於推薦系統場景之中,不過現有工作很少對這個方向進行研究,但其實使用者的不同行為反映了不同的偏好。
推薦系統中行為的異構性(挑戰)
- 不同行為之間的相關性極為複雜。不同使用者有著不同的行為模式。
- 每一種行為都有其背後的語義資訊。比如,點選行為的發生比購買更為頻繁。
- 不同行為對最終決策的重要程度是如何的呢?
Memory-Augmented Transformer Network(MATN)
主要是基於關係學習的方式來做的,接下來我們挨個來看各模組。
假設每個使用者有多個行為,每個行為都有一個表徵,也就是說這個使用者擁有多個embedding,每個embedding具有不同的語義。透過memory增強把每個行為的表徵對映到一個多維度的網路中去。這相當於我們透過不同的語義維度去學習這個行為本身增強的資訊。
多行為中比較關鍵的是去考慮不同行為之間的關係。
我們在這裡面用的是這個Mult-head Self-attention的方式,學習兩兩行為之間的關係。
最終在做預測的時候,我們是希望能夠學到一個統一的unify的表徵。
我們希望對使用者學到表徵,再針對商品進行預測。最後用到了Gating Mechanism這個方式去學習。
這個模型總體來說是有3個模組。
第一個模組:學到每個行為獨自的語義資訊
第二個:學習到不同行為之間兩兩的關係
第三個:最終預測的時候,學習每個行為對於最初預測行為的作用有多大
該模型優勢:可以比較顯式的展現行為對於最後預測時究竟起到什麼作用。比如使用者點選這個商品之後有多大的機率會去買。
後續在之前模型之上做了一個高階資訊的版本,建立在使用者高階連線資訊的多行為模式。
首先我們需要兩個維度的資訊。
1)我們如何把額外的商品屬性抓取進來,考慮到使用者和商品之間多行為互動
2)時間的維度。不同商品和使用者發生互動的時間不一樣,那麼和使用者表徵學習不一樣。將時間資訊以類似position embedding的方式注入到整個transformer框架中。
使用者的資訊來源於商品,而商品的資訊來源則有兩個維度。一個是和他相關聯的商品,一個是和他有互動的使用者。
我們需要在訊息傳遞的時候需要考慮到異構性因素,這樣我們就可以弄清在訊息傳遞時是哪種行為的訊息對使用者的表徵是增強的。
除了上述這些對行為異構性進行區分的方法之外,還有一個關鍵點就是——不同使用者的多行為模式不同。比如有些人就是喜歡在電商平臺閒逛,但是很少買;而有一部分人就是喜歡直接去看自己感興趣的商品。下面介紹下研究這個方向的一篇paper。
這裡我們引入了一種基於自監督的對比學習方式。對比學習中,我們需要找到不同的維度,然後對其進行推近和拉遠操作。
這時我們的每一個行為都代表的是一種使用者的互動的模式。我們會在每個使用者的不同行為之間進行互資訊的計算。在一定程度上去拉近不同行為,希望透過對比學習模式對行為之間的獨立性進行學習。因此,我們引入了Meta Network,藉此來學習不同的權重資訊。因為在整體的環境下,我們希望可以實現個性化的函式。每個使用者引數生成取決於自己的embedding或說行為。利用的是每個使用者的互動行為不同而進行其自身的表徵學習。
三、模型表現
我們對比了一下傳統GCN的方法,並且對比了一些現有的多行為方式。在這個結構之中,可以看出我們的模型是較優的。
我們的模型對於一些稀疏型的使用者在一定程度之上也可以起到增強作用。
在評估結果的時候,我們對於這種不同互動行為的使用者劃分成不同的group,然後在不同的group之中進行單獨的效果驗證。我們可以看出,我們的模型相對其它baseline佔優,尤其是面對稀疏使用者。
另一個場景是在動態推薦系統之中對異構性進行學習。因為最終行為都是基於時間資訊,比如使用者逛街先看衣服,之後鞋子、褲子,最後加入購物車的順序則並不相同。此時的使用者多行為模式可以在行為序列建模中透過短期與長期兩種模式進行學習。
整個框架,將序列分為子序列,代表區域性模式。我們融合了transformer模式,然後在全域性下進行訊息傳遞,把行為型別作為一種額外的embedding方式注入到整個模型之中,最後再次進行一個global模式下的訊息傳遞。
四、未來方向
- 行為資料稀缺下的學習
- 推薦場景下,可解釋的異構關係互表示(哪些行為影響了最終決策)
- 實時計算框架(常見app所用的推薦演算法)
- 推薦場景之下,如何在多模態資訊進行融合並與異構資訊進行互動?
論文連結:
https://www.ijcai.org/Proceedings/2020/601