// 保險客戶理賠的複雜處理場景
在之前的文章中,我們已經瞭解到保險公司處理理賠業務的場景。在這個場景中,我們有意簡化了關於對客戶所提交的證明材料的稽核過程。其實,保險公司每年面對數百萬計的理賠業務,理賠證明材料的核實是一項巨大的工作負荷,也帶來了巨大的人力投入。例如,醫療保險材料中包含診斷證明、檢驗結果、收費單據等,這都需要理賠專員逐筆核對理賠材料、理賠金額與申請理賠內容是否一致。所以,基於之前文章中的流程圖,我們增加了一個步驟“檢查理賠附件是否正確完整”來體現此項工作,如圖所示。
如果我們依然只是採用RPA來解決理賠問題,檢查理賠附件材料的過程仍然需要由理賠專員來處理,如圖所示。
為了真正解決材料的稽核自動化處理流程,我們必須要結合人工智慧技術。檢查單據的流程主要包含兩個部分,一個是檢查單據的完整性,即需要提交的材料是否都已經提交;另一個是檢查單據中資訊的正確性,即單據中的資料與理賠申請請求是否一致。
為了檢查完整性,首先需要對單據進行分類,然後檢查單據的類別和數量是否與業務規範中的要求一致。分類問題可以利用機器學習(Machine Learning)和深度學習(Deep Learning)來解決,而且在應用前需要利用大量的樣本資料對分類模型進行訓練。有別於傳統的識別方法——利用票據中的資料特徵值分類的方式,深度學習採用的是對單據的完整掃描圖片進行特徵判斷,生成分類模型。當然,在實際應用中為了分類效果更好,人工智慧的方法可以和傳統的特徵識別方法相結合使用。這個處理過程和利用人工智慧識別圖片中哪些是狗、哪些是貓的方法是類似的。樣本資料的訓練過程如下。
為了檢查正確性,我們需要使用OCR和NLP技術來對單據的內容進行處理。由於目前的OCR技術還無法完全實現對未知格式的影象的識別,這就需要基於前面單據影象分類進行OCR識別。OCR技術可以是對全域性文字的識別,也可以是對切割後的區域性文字的識別,主要依據是單據的特點。我們只要獲取需要比對文字資訊的最小集就可以,而沒有必要將全部文字資訊完整地識別出來。對於識別出來的那些用自然語言表達的文字,需要利用NLP技術將所需要的關鍵資訊提取出來。當獲得最終的資訊後,理賠專員再和理賠申請表中的資訊比對就可以了。當然在比對過程中,我們依然可以採用NLP技術來儘量減小OCR識別的錯誤率。
最終,我們得到的理賠處理流程如圖所示。
在這個場景中,透過機器學習、深度學習、NLP、OCR和RPA等技術尚不能100%解決所有單據的審查,但至少保險公司可以有針對性地選擇處理業務量最大的那些單據,極特殊情況以及異常情況仍舊反饋給理賠專員來完成核對。