帶著觀點看商業。超級觀點,來自新商業踐行者的前沿觀察。
文|顧夏輝(子長科技CTO)
語言是人類思維的基礎,當計算機具備了處理自然語言的能力,才具有真正智慧的想象。自然語言處理(Natural Language Processing, NLP)作為人工智慧(Artificial Intelligence, AI)的核心技術之一,是用計算機來處理、理解以及運用人類語言,屬於計算機科學與語言學的交叉學科。目前,NLP乃至人工智慧的落地情況如何?是舉步維艱,還是已經獲得廣泛應用?
毫無疑問,已經有越來越多的企業認可NLP技術,並在相關專案上進行了大量投入,但NLP技術在具體商業落地中依然存在挑戰。企業投入需要回報,無論是提升效率,提高輸入,還是為企業各個業務賦能,歸根結底,都是需要技術應用能夠真正為企業帶來價值。因此落地的重點不是使用NLP技術或者其他人工智慧技術所完成一個企業應用,而是要看這些應用是否解決了客戶的痛點,為企業帶來真正的價值。
舉例來說,1STEP.AI與金賦科技合作開發了一個“智慧送策“專案,主要是把企業資訊與各地政府的扶持政策進行匹配,幫助企業找到適用的政府扶持政策。這項工作之前依靠人工進行,困難重重,原因一是企業和政策的資料量都非常大,且資料持續更新;原因二是政策中的條件關係多樣化(並列關係、選擇關係等),匹配邏輯複雜。人工操作的侷限在於處理的數量有限,時間長,匹配錯誤率高。
和通常人們的理解不同,在這個例子當中,利用技術進行準確的抽取並不能真正解決客戶的痛點。比如,一個政策中對於企業的要求有20條,如果政策抽取的模型準確率比如是95%,但是正是由於有一條關於企業註冊地點的特性沒有抽取出來,直接導致匹配的公司會多出幾十倍甚至上百倍,這樣的政策抽取結果對於匹配公司的業務來說,其價值幾乎為零。因為抽取的結果並不能提供準確的目標公司集。因此1STEP.AI和金賦科技並沒有把政策抽取和邏輯關係抽取的準確度作為目標,而是把目標定為政策所匹配的公司的準確度。這個目標符合業務需求而不是簡單的用人工智慧完成一個應用,但是該目標的難度比簡單的政策抽取複雜很多。其實,任何一個商業應用都是複雜的問題,而人工智慧的模型更適合解決困難問題。什麼是困難問題呢?什麼是複雜問題?困難問題類似於圍棋、影象識別這樣的問題,規則簡單,但是實際情況或者玩法困難。而複雜問題是指規則複雜,流程繁多的問題。所以,對於商業應用的複雜問題,最搞笑的方法是多個模型協作解決問題。
在“智慧送策”專案中,這個複雜問題是什麼呢?首先,政策往往包含了很多內容,所以需要在政策中找到包含政策要點的段落,再在段落中找到政策要點。要點和要點之間存在著邏輯關係,多個要點可以是“並列“的關係,也可以是”或者“的關係。一個政策檔案中又有可能包含多個政策,這些政策之間也存在著邏輯關係。在“智慧送策”系統中使用的模型包括:段落抽取(準確度0.99),政策實體抽取(準確度0.98),對映模型(準確度0.88),語義邏輯模型(累計準確度0.85)。把上述模型結合起來才能夠提供具有商業價值的落地方案。
透過以上模型的協作,“智慧送策”透過人工智慧技術,可以自動高效地解決企業實體資訊抽取、屬性對映、邏輯關係匹配等複雜問題,將匹配公司的結果準確度從人工操作的78%提升到89%;在一些政策條目下,覆蓋的企業數量增加了11倍以上,大大推動了業務的快速拓展。
人工智慧產業結構已經日趨成熟,它包括了三個層面:包括軟硬體設施和資料服務的基礎層、囊括了基礎框架、演算法模型以及通用技術的技術層以及輻射到各行業中的產品、服務和解決方案的應用層。NLP是技術層的重要組成部分之一,是認知智慧時代的關鍵技術,可以說,NLP能力對行業應用的落地、企業的轉型升級都具有決定性的作用。
NLP技術的價值在於海量資料處理,它的應用靈活且包羅永珍,目前多體現在增進資料洞察、實現智慧互動、提高運營效率和替代重複性勞動等方面。作為應用模組,落地範圍非常廣泛。基於不同行業客戶的需求和業務痛點,在各種行業場景中都有滲透。在處理海量的結構化資料和非結構化資料上,具有人工無法企及的能力和效率,例如文字資料的識別、抽取、匹配與處理,廣泛的網路資料獲取和分析等。
我們已經發現有越來越多的可以使用人工智慧技術進行最佳化和革新的場景。在這些場景中應用應用NLP技術是否能夠解決痛點,為企業創造真正的價值才是落地場景的關鍵。