使用者畫像精準化平臺系統實踐
1.從百度地圖POI庫中抓取城市的所 有公司名和學校名,對其分詞,人 工編寫規則對分詞結果進行處理, 轉化為一個角色標註序列
2.收集所有的詞語和角色,得到一 個角色詞典,並對角色去除字尾訓 練對應的NGram模型
3.收集所有的角色標註序列中的角 色序列,制定為一個規則集
4.對於輸入的一個訂單地址,先使 用角色詞典標註,然後使用相應後 綴的NGram進行召回,得到一個角 色標註序列。對一個角色標註序 列,滿足上述規則集的就是一個命 名實體。
關注+私信回覆「使用者畫像」免費獲取 使用者畫像和精準化平臺系統實踐 PDF