sponsored links

乾貨!推薦系統中的異構關係學習

精確實現城市中異常事件的預測,在智慧城市中智慧交通以及城市公共安全的應用中起著重要的作用。為實現該目的,我們的研究工作從以下兩個重要層面對時空資料進行建模: 1)學習異常事件在時間維度上的動態和高階屬性;2)不同維度資料模型(時間,空間以及語義維度)的互動的特性。在該論文中,我們提出了一種基於互動注意力機制的時空資料預測模型,透過異構注意力模組的協同作用,我們可以實現對城市異常事件在不同維度上的呈現出來的不同資料模式的自動學習。透過在實際時空資料上的實驗測試,我們所提出的新演算法相較於現在的演算法呈現出更有的預測效果。

AI TIME 特別邀請了香港大學計算機學院助理教授,博士生導師——黃超,給大家帶來分享《推薦系統中的異構關係學習》。

黃超:博士畢業於美國聖母大學,香港大學計算機學院助理教授,博士生導師。目前主要的研究方向主要為人工智慧,資料探勘,時空資料分析,推薦系統。在KDD, WWW, AAAI, IJCAI, SIGIR, CIKM, WSDM等資料探勘和人工智慧領域頂級會議發表論文30餘篇。其中計算機學會A類14篇。以第一作者發表的論文曾獲得WWW’2019最佳論文提名。與此同時,擔任了KDD, WWW, AAAI, IJCAI, SIGIR, WSDM, CIKM, ICLR等會議的評審委員會委員,以及TKDE, TOIS, TIST, TOC, TKDD, TNNLS等期刊的長期審稿人。並且被WSDM’2020會議授予優秀評審獎。



推薦系統在當下應用的十分廣泛。無論是當下的國民級app—抖音,還是我們平時常用的一些電商平臺,都可以見到推薦系統的身影。推薦系統現在基本上是作為一個線上的使用者建模平臺中的一個關鍵技術。

我們今天介紹的主要是推薦系統中的異構關係。舉個例子,使用者側我們在線上電商平臺購物的時候都會遇到一些社交關係,這樣我們在做決策的時候多少也會受到這些好友的影響。

在商品側,知識圖譜所包含的商品語義資訊也是一個很關鍵的刻畫。

在使用者與商品的互動層面,我們會把喜歡的商品新增到收藏列表,我們也會把覺得ok的商品放到購物車,這樣說明使用者與商品的互動層面也是存在異構關係的。

綜上說明,異構關係是普遍存在的。我們希望在推薦系統中無論是對錶徵的學習,還是使用者興趣的學習,都進行一個joint learning。

使用者維度的社交關係social relationship也是會影響到使用者決策的。

而在商品維度,我們會對商品的語義資訊進行建模。可能是同屬一個類別,我們基於這些各式各樣的資訊,可以建立一個商品基於這種關係的圖,然後如何在這個圖上學習並建立一個使用者和商品融合的關鍵點是我們接下來要重點關注的。

我們接下來主要做的就是探索如何在使用者和商品之間的互動中進行joint learning。

今日架構介紹,主要有兩種架構:

(1)Graph Convolutional Network-based Models(GCN).

受圖譜學習框架-圖卷積網路(GCN)的啟發,一些研究透過在社交網路上遞迴傳播資訊來模擬使用者之間的影響過程,以細化使用者和物品表示。

(2)Graph Attention Network-based Moddels(GAT).

為了區分鄰域特徵聚合的重要性,提出了一種利用節點空間資訊嵌入傳播的非譜學習方法——圖注意網路(GAT)

一、現有方法

缺少對於使用者和商品兩個維度的sign information 去joint learning的方式,所以希望可以透過對異構關係的學習加強對推薦系統的學習。

我們採用以下三圖作為我們方法的input:

然後用這個使用者的社交資訊和商品的知識圖譜資訊作為額外的異構關係資訊,我們希望能夠預測使用者是否決定去點選或購買某個商品。我們將這個整體方法定義為一個coorative的異構圖資訊。

在這個場景中,我們需要考慮該如何提取資訊,從以下5個方面:

當前GCN作為推薦系統裡比較普遍的一個模型,然後我們用GCN對整個graph進行encoding。對於使用者和商品,我們都得到了相應的表徵資訊。之所以用GCN,主要考慮到就是快,GAT可能每次傳遞訊息都要計算attentino,會帶來更大開銷。

針對我們有的這5個graph,我們在這裡是從使用者維度和商品維度進行綜合學習。最終的出對於使用者和商品都學到了一個attention來代表5個graph的每一個語義。

當前GCN作為推薦系統裡比較普遍的一個模型,然後我們用GCN對整個graph進行encoding。對於使用者和商品,我們都得到了相應的表徵資訊。之所以用GCN,主要考慮到就是快,GAT可能每次傳遞訊息都要計算attentino,會帶來更大開銷。

針對我們有的這5個graph,我們在這裡是從使用者維度和商品維度進行綜合學習。最終的出對於使用者和商品都學到了一個attention來代表5個graph的每一個語義。

這裡我們用到的主要是一種基於自監督的方式,自監督可以分為generative和contrastatic兩種方式,目的是在整個的推薦系統場景下有些資料較為稀疏甚至有噪聲。自監督是希望可以額外引進一個學習的任務,來對推薦系統裡的模型增強。既然我們考慮到了這個因素,所以我們希望可以在使用者和商品之間注入一個高階資訊。

使用者本身有一個local level的一個embedding,還有他們的social graph,這裡我們會去學一個 graph embedding。最終我們會進行互資訊的計算,透過額外的任務——判斷這個node是否屬於這個sub-graph。透過引入整體的自監督任務,就可以學到模型中使用者本身的高階資訊。

這個模型等於是學習到了使用者local interaction的方式,同時也考慮到了高階資訊。

以上就是同時考慮到使用者的社交資訊和商品的知識圖譜,這兩個維度共同來對整個使用者的表徵學習進行增強。

二、模型實驗結果:對比多類推薦系統

第一個要對比的就是社交推薦的模式

第二個商品之間對比的是對於知識圖譜增強的推薦系統演算法

我們主要的關注點是對異構關係的學習,我們拿現有的異構圖網路相關方法作為baseline,考慮到5個維度,對比實驗結果如下:

每一個方面的relation對於整體的增強都起到來正面效果,說明不同的異構關係對於整個推薦系統都是有促進作用的。

除了從使用者和商品兩個維度進行研究工作之外,還有研究使用者與商品之間的多互動行為。

使用者的多種行為是廣泛存在於推薦系統場景之中,不過現有工作很少對這個方向進行研究,但其實使用者的不同行為反映了不同的偏好。

推薦系統中行為的異構性(挑戰)

  • 不同行為之間的相關性極為複雜。不同使用者有著不同的行為模式。
  • 每一種行為都有其背後的語義資訊。比如,點選行為的發生比購買更為頻繁。
  • 不同行為對最終決策的重要程度是如何的呢?

Memory-Augmented Transformer Network(MATN)

主要是基於關係學習的方式來做的,接下來我們挨個來看各模組。

假設每個使用者有多個行為,每個行為都有一個表徵,也就是說這個使用者擁有多個embedding,每個embedding具有不同的語義。透過memory增強把每個行為的表徵對映到一個多維度的網路中去。這相當於我們透過不同的語義維度去學習這個行為本身增強的資訊。

多行為中比較關鍵的是去考慮不同行為之間的關係。

我們在這裡面用的是這個Mult-head Self-attention的方式,學習兩兩行為之間的關係。

最終在做預測的時候,我們是希望能夠學到一個統一的unify的表徵。

我們希望對使用者學到表徵,再針對商品進行預測。最後用到了Gating Mechanism這個方式去學習。

這個模型總體來說是有3個模組。

第一個模組:學到每個行為獨自的語義資訊

第二個:學習到不同行為之間兩兩的關係

第三個:最終預測的時候,學習每個行為對於最初預測行為的作用有多大

該模型優勢:可以比較顯式的展現行為對於最後預測時究竟起到什麼作用。比如使用者點選這個商品之後有多大的機率會去買。

後續在之前模型之上做了一個高階資訊的版本,建立在使用者高階連線資訊的多行為模式。

首先我們需要兩個維度的資訊。

1)我們如何把額外的商品屬性抓取進來,考慮到使用者和商品之間多行為互動

2)時間的維度。不同商品和使用者發生互動的時間不一樣,那麼和使用者表徵學習不一樣。將時間資訊以類似position embedding的方式注入到整個transformer框架中。

使用者的資訊來源於商品,而商品的資訊來源則有兩個維度。一個是和他相關聯的商品,一個是和他有互動的使用者。

我們需要在訊息傳遞的時候需要考慮到異構性因素,這樣我們就可以弄清在訊息傳遞時是哪種行為的訊息對使用者的表徵是增強的。

除了上述這些對行為異構性進行區分的方法之外,還有一個關鍵點就是——不同使用者的多行為模式不同。比如有些人就是喜歡在電商平臺閒逛,但是很少買;而有一部分人就是喜歡直接去看自己感興趣的商品。下面介紹下研究這個方向的一篇paper。

這裡我們引入了一種基於自監督的對比學習方式。對比學習中,我們需要找到不同的維度,然後對其進行推近和拉遠操作。

這時我們的每一個行為都代表的是一種使用者的互動的模式。我們會在每個使用者的不同行為之間進行互資訊的計算。在一定程度上去拉近不同行為,希望透過對比學習模式對行為之間的獨立性進行學習。因此,我們引入了Meta Network,藉此來學習不同的權重資訊。因為在整體的環境下,我們希望可以實現個性化的函式。每個使用者引數生成取決於自己的embedding或說行為。利用的是每個使用者的互動行為不同而進行其自身的表徵學習。

三、模型表現

我們對比了一下傳統GCN的方法,並且對比了一些現有的多行為方式。在這個結構之中,可以看出我們的模型是較優的。

我們的模型對於一些稀疏型的使用者在一定程度之上也可以起到增強作用。

在評估結果的時候,我們對於這種不同互動行為的使用者劃分成不同的group,然後在不同的group之中進行單獨的效果驗證。我們可以看出,我們的模型相對其它baseline佔優,尤其是面對稀疏使用者。

另一個場景是在動態推薦系統之中對異構性進行學習。因為最終行為都是基於時間資訊,比如使用者逛街先看衣服,之後鞋子、褲子,最後加入購物車的順序則並不相同。此時的使用者多行為模式可以在行為序列建模中透過短期與長期兩種模式進行學習。

整個框架,將序列分為子序列,代表區域性模式。我們融合了transformer模式,然後在全域性下進行訊息傳遞,把行為型別作為一種額外的embedding方式注入到整個模型之中,最後再次進行一個global模式下的訊息傳遞。

四、未來方向

  • 行為資料稀缺下的學習

  • 推薦場景下,可解釋的異構關係互表示(哪些行為影響了最終決策)

  • 實時計算框架(常見app所用的推薦演算法)
  • 推薦場景之下,如何在多模態資訊進行融合並與異構資訊進行互動?



論文連結:

https://www.ijcai.org/Proceedings/2020/601

分類: 寵物
時間: 2022-04-06

相關文章

現代簡約風,簡潔舒適,讓生活更加愜意

現代簡約風,簡潔舒適,讓生活更加愜意
合理簡化居室軟裝,從簡單舒適中體現出生活的精緻與愜意. ▲進入客廳就給人素雅之感,沙發背景牆採用淨色打造,紅色裝飾畫成為點綴. ▲餐廳與客廳相連,大理石餐桌搭配絨質時尚餐椅,提升了空間的溫度與格調. ...

詩詞中的農家,光景美如畫,愜意的生活在鄉村

詩詞中的農家,光景美如畫,愜意的生活在鄉村
歡迎大家閱讀"景德鎮南河公安"頭條號.如果您喜歡本頭條號釋出的文章,還可點選左上角關注我的頭條號,每天都有精彩文章推薦. 文丨詩詞君 來源丨詩詞天地 每一個內地的人,都向往著大海. ...

村民變股東 生活更安心

村民變股東 生活更安心
"誰說旅遊是城裡人的專屬!現在村裡生活好了,我們農民也有條件出去玩玩了."中秋假期,九原區麻池鎮武家村村民吳元元帶一家人近郊遊玩.爬山.露營,最後在景區附近吃了一頓,生活好不愜意. ...

初秋的青島,以愛之名,打卡15個網紅景點,看見青島的每一種生活

初秋的青島,以愛之名,打卡15個網紅景點,看見青島的每一種生活
青春.自由.文藝.小資.愛情,每一個字眼跳進眼裡,都讓我不由自主想到青島. 第一次來青島,就對這座海濱城市無比的愛,青島是一個有故事的城市,這座青春之城既有小資浪漫的一面,也是厚重滄桑的一面,我用四天 ...

《挑戰古人100天》:古人會玩?今人焦慮?生活的真諦在哪裡?

《挑戰古人100天》:古人會玩?今人焦慮?生活的真諦在哪裡?
有報告顯示,早在2018年中國寵物(犬貓)消費市場規模就達到1708億,人均單隻年消費金額5016元,中國城鎮養寵使用者7355萬人,其中養狗.貓人數5648萬.2017年的時候,某寶雙十一活動的消費 ...

23歲爆紅,娶18歲初戀,28歲兒子夭折,歐陽奮強如今怎樣了?

23歲爆紅,娶18歲初戀,28歲兒子夭折,歐陽奮強如今怎樣了?
29年後,有個"半仙兒"建議他改名為歐陽寶玉. 那時的歐陽奮強已是知天命之年. 戴著半生導演頭銜行走江湖,到頭來在人群中,人們見到他的第一句話還是: "這是賈寶玉嗎?&q ...

她造出美國首枚核彈,拿到中國第一張綠卡,為何卻在中國農村養牛

她造出美國首枚核彈,拿到中國第一張綠卡,為何卻在中國農村養牛
1953年7月份,一篇"一個逃掉的原子間諜"美國雜誌文章,在世界上掀起了波瀾. 文章中所指的原子間諜,便是美國人寒春.她參與了美國首枚原子彈製造,掌握著製造原子彈的核心機密. 然而 ...

24歲小夥用一個月工資,改造小陽臺,花一點錢改成自己喜歡的樣子

24歲小夥用一個月工資,改造小陽臺,花一點錢改成自己喜歡的樣子
很多時候,我們家裡的陽臺都沒有被充分利用起來,甚至會顯得有些雜亂,但實際上它的潛力很大!最近就有位24歲的小夥,用一個月工資的錢改造了他家的小陽臺,真是帶給我不少啟發! 今兒我們就一起來看看這位小夥家 ...

要說多少遍,櫃子就不需要拉手,學學他家,太贊

要說多少遍,櫃子就不需要拉手,學學他家,太贊
現代輕奢風的設計,真的百看不厭,搭配無拉手的設計,真的非常高階. 下面是一套很受歡迎的案例,快來一起參考參考. 房屋資訊 建築面積:150㎡ 戶型:三房兩廳 常住人口:3口人 所在城市:廣東 廣州 設 ...

養貓前後對比,你是第幾個?

養貓前後對比,你是第幾個?
有人說,貓是PUA界的高手,剛開始我還不信. 小貓咪能有什麼壞心眼呢? 和它們在一起的日子溫馨又甜蜜,美好得就像談戀愛,提起"我家貓"就忍不住紅了臉. 直到-某一天我突然發現: 養 ...

趁著中秋十一小長假,帶父母到這5個地方,看看外面的世界

趁著中秋十一小長假,帶父母到這5個地方,看看外面的世界
你帶爸媽出去旅行過嗎? 有沒有發現工作越來越忙,回家就越來越少,更別說帶父母出去旅行了,那不如就趁即將到來的中秋十一小長假,帶上父母到外面的世界看看!推薦最適合帶父母出遊的5個地方,有你爸媽喜歡去的嗎 ...

進化論的終極BUG:烏龜,如何成為科學家們的噩夢?

進化論的終極BUG:烏龜,如何成為科學家們的噩夢?
要說在地球生物的演化階段裡,有哪個時期最讓古生物學家感到頭疼,那麼無疑是三疊紀以前.因為從5億多年前寒武紀物種大爆發,一直到三疊紀生物大滅絕,這段時間裡的古生物長相一個比一個奇葩,看著它們的化石,你會 ...

這就是遵義!

這就是遵義!
七十二道拐.圖片來源:視覺中國 這裡 說"經常"是"緊倒" 這裡 說"以後"是"二天" 這裡 閨蜜喜歡去"槓該 ...

清華女博士後拒絕企業聘請,紮根農村種地11年,年入800萬美元

清華女博士後拒絕企業聘請,紮根農村種地11年,年入800萬美元
先畢業於河北農業大學,後進入中國人民大學進行碩博連讀,隨後又到清華大學人文與社會科學學院攻讀博士後.21世紀初期,不到30歲的石嫣就已經有了如此優秀的履歷. 在改革開放近三十年的這段時間,中國農業有了 ...

什麼叫“四季房車”:雙層地板,極限防凍!朗宸C60房車

什麼叫“四季房車”:雙層地板,極限防凍!朗宸C60房車
決定房車儲物能力的因素,並不能透過房車大小直接判斷,更多需要從內部空間利用率是否合理來斷定.今天我們帶來的朗宸C60就很好利用了隱藏在地臺下方的空間,即使沒有拓展艙結構,內部依然能為使用者帶來面積充裕 ...

讓人從BBA上移開目光 試駕沃爾沃新款XC60

讓人從BBA上移開目光 試駕沃爾沃新款XC60
說到北歐,很多人都會想到瑞典這個國家,在中國最具有代表性的瑞典品牌就有沃爾沃,還有宜家.他們身具的來自北歐的極簡主義總是能夠吸引大家的關注,與眾不同卻又有著一種獨特的品質感.這次車德鋼來到成都的目的就 ...

如何助力“碼農”成為當代“數字工匠”

如何助力“碼農”成為當代“數字工匠”
來源:光明日報 如何助力"碼農"成為當代"數字工匠" 2021年5月,山東科技大學舉辦青島市"工業網際網路"領域專項招聘會.韓洪爍攝/光明圖 ...

環貿iapm商場「潮力啟航」時尚季 正式啟幕180°環拍大片

環貿iapm商場「潮力啟航」時尚季 正式啟幕180°環拍大片
2021年9月18日 金秋時節,環貿iapm商場特別打造「潮力啟航」時尚季,攜眾多國際時裝大牌及著名插畫藝術家Dawn Oman開啟秋日出行新體驗,以多元藝術形式及潮流合作詮釋"時尚藝術×可 ...

兔子喝了水就容易一命嗚呼?非也,只要保證水質乾淨即可

兔子喝了水就容易一命嗚呼?非也,只要保證水質乾淨即可
其實獸醫小明有時候挺羨慕那些生活在鄉下的人,因為他們的生活很愜意,也許在幹農活的不經意間就會發現一些小驚喜,比如平時所見不到的小動物. 來看看下面這個網友分享的小故事,有沒有可愛到你呢? 這位網友某天 ...

文明崩塌下依然有光!蘿莉與大叔並肩,《風來之國》的故事太溫情

文明崩塌下依然有光!蘿莉與大叔並肩,《風來之國》的故事太溫情
人類遭遇末日危機,為了生存,一位大叔和蘿莉走上一條尋找人類生存的道路,藍色和綠色並存,茂盛的植被成為城市新的主人,兩個相互依靠的身影在城市中艱難跋涉.看到這裡你是不是以為我要說的是電影情節?其實這是皮 ...