什麼是相似問,為什麼要編寫相似問?
相似問是為了完善機器人教育的一種手段,相似問同原始語料一樣,都是機器人學習的物件,是提供模型訓練的材料。
相似問是在使用者日誌、行業資料複用、網上爬取相關問句等都不足以完成機器人訓練時,我們才會用到的一種最基本也是最強硬的手段。
也就是說,當我們完成了原始語料的歸檔後,這個時候我們能夠得到對應場景下分類的客戶原始問法以及對應的應答內容。但在實際的訓練過程當中,我們會發現某一類場景,並沒有原始語料能夠覆蓋,這個時候就需要根據自己以往的服務經驗,結合業務場景去補充這些缺失場景下面的語料問答對。
在進行缺失場景語料問答對的補充時,應該注意以下原則:
必須要結合實際業務場景;
必須要遵循使用者思維進行補充。
不能僅僅只是進行業務場景的概括。例如:退貨場景缺失語聊,需要用“如何進行退貨?”/“怎麼進行退貨?”/“我想要退貨,怎麼處理?”這樣具備使用者思維問法的方式編寫,而不是“退貨處理”。
機器人正確的運轉邏輯是將千奇百種客戶的問法匹配到一個具有概括性的標準問上面去。所以針對歸檔後的語料進行標準化,本質上是將客戶的原始語料轉化成標準問的一個過程。
相似問編寫的優點如下:
1、易操作,只需要在產品系統編輯新增後提交或者用EXCEL批次操作後匯入即可。
2、見效快,人工編寫相似問來教育長尾的FAQ問題可以快速的幫助機器人達到一個全面教育的水平。
當然,相似問編寫也存在以下缺點:
1、工作量大,一般上線的業務往往會有幾百上千個FAQ,其中長尾問題佔大多數,如果全部透過人為新增相似問來教育,工作量很大。
2、侷限性,相似問的編寫因人而異,同一個FAQ不同人想到的相似問都會有差異,一般情況下,人工編寫相似問是沒辦法覆蓋到無窮的使用者真實問句。
因此,為了更好的編寫相似問,提高效率,相似問編寫可以遵循以下的原則和規範:
1. 根據問答對的語義模擬客戶對此知識點進行諮詢,用該知識點能解答相似問句中問到的問題。
如:公司的薪酬水平如何?
模擬使用者提問題,可以是“你們公司的薪資是多少?”“你們公司待遇怎樣呢?”
2. 儘量口語化,不要用固定模版套用。
如:公司的薪酬水平如何?
口語話提問,可以是“我看到你們在招聘,你們這裡工資高不高?”
3. 關鍵詞需要多變化不同問法(一般來說,句子中實詞意義大於虛詞,n,v >> adj >> adv >> 語氣詞),變化問法的同時需要變換句式。
如:公司的薪酬水平如何?
此問答對的關鍵詞為:薪酬、水平如何。重點詞變化可以為“你們公司的待遇怎樣?”,“我想了解下你們的薪水情況”。
4. 對於語義相近的兩個問答對,新增相似問句時應注意強調區別特徵詞。
示例:如何使用手機銀行進行轉賬?VS 如何在官網進行轉賬?
“手機銀行”和“官網”就是這兩個問答對的語義區別特徵,編寫資料時應進行強調。
5. 可以根據答案輔助理解知識點,提出不同的相似問法,但不能只根據答案編寫,偏離標準問句的語義。
如: 舉報電話是?答案:舉報電話專線:XXXXX。另外,您也可以撥打我司客服電話955XX反饋
根據答案提問可以為“010-58289XXX是你們的舉報電話嗎?”
另外還需要注意的是,相似問的補充不是把客戶的同樣一句話換一個說法然後翻來覆去的講,而是要結合著客戶實際會說的場景來進行補充。
如:
異地取款手續費多少?
異地取款手續費是多少?
異地取款的手續費?
異地取款收費收取?
而是:
我人在外地,取款手續費多少?
我在外地取款收取多少手續費?
我在外地取錢手續費多少?
這才是正確的相似問補充方式。
異地取款中,異地=外地;取款=取錢,如果以客服的視角,我們通常為了保證說法的一致性和標準性,我們通常都會說:“異地”和“取款”,但客戶往往都會常說的是“外地”和“取錢”。針對這種情況,要進行相似問補充,不僅僅要對句子相似問補充,還應該對這個句子中的關鍵詞進行同義詞、相似詞的補充;具體的補充方式需要根據各個客服中心機器人後臺設定要求來進行,例如有的機器人是將同義詞相似詞補充單獨放在業務場景梳理中,即針對業務場景錄入,要求訓練師補充同義詞的訓練場景用詞,有的機器人是單獨作為一個詞典的獨立存在,讓關鍵詞進行獨立存在的補充。
在進行相似問的補充時,可能會遇到以下的問題:
1.相似問補充工作量巨大;
2.相似問補充因人而異如果只讓固定人進行相似問補充,很容易形成思維定勢,導致最後的相似問可用性差;
3.同一個問題對相似問是無窮無盡,難以完全覆蓋使用者的真實問法相似問。
幾個建議:
解決方法一:閱讀大量客戶原始日誌,進行相似問撰寫
要求訓練師在進行相似問編寫之前,大量閱讀客戶原始日誌,將自己的思維帶入到客戶的思維去模擬客戶問題的方式,這樣用以保證撰寫出來的相似問是最符合客戶問法的相似問。
解決方法二:客服中心人工客服機器人提問知識競賽(限制範圍)
發動客服中心,大量人工客服舉行相似問知識競賽,讓大量人工客服參與到相似問的編寫過程中來,在編寫之前需要明確相似問編寫原則和規範,並提供出錯誤相似問編寫示例。
解決方法三:規則語言囊括相似問
使用程式設計中的規則對相似問進行正則表示式編寫,如:我想查詢天氣情況。使用正則編寫其相似問為:[請問|查下|告訴我]${date}${city}[的]天氣[預報|情況|狀況][如何|怎麼樣|好不好]。
解決方法四:研發相似問自動生成系統
以上的相似問編寫的方法都是依靠訓練師人工進行操作,那能否讓機器人幫我們進行相似問的編寫呢?答案是肯定的,但要考慮成本。