深度學習,是機器學習領域中一個新的研究方向,它被引入機器學習使其更接近於最初目標--人工智慧。深度學習是學習樣本資料的內在規律和表示層次,這些學習過程中獲得的資訊對諸如文字,影象和聲音等資料的解釋有很大的幫助。
它的終極目標是讓機器能夠像人一樣具有分析學習能力,能夠識別文字、影象和聲音等資料。深度學習是一個複雜的機器學習演算法,在語音和影象識別方面取得的效果,遠遠超過先前相關技術。
目前,深度學習在搜尋技術,資料探勘,機器學習,機器翻譯,自然語言處理,多媒體學習,語音,推薦和個性化技術,以及其他相關領域都取得了很多成果。深度學習使機器模仿視聽和思考等人類活動,解決了很多複雜的模式識別難題,使得人工智慧相關技術取得了很大進步。
簡而言之,深度學習就是讓機器像人一樣主動去學習,目標就是人工智慧。近年來,深度學習的進步已經成為推進AI技術發展的核心動力,讓計算機進行練習,透過消化和分析大量資料,而不用明確程式設計,就可以達到目的。
2016年,谷歌以深度學習為基礎的阿爾法狗(AlphaGo)擊敗了世界圍棋冠軍李世石,令大多數人工智慧專家感到震驚,因為他們認為需要5-10年才能實現這一目標。而當谷歌於2016年底轉向其新的深度學習AI系統後,它極大地提高了機器翻譯的質量。
隨著深度學習技術的不斷髮展,它還衍生出許多實際應用,主要是在推理與決策等方面取得了突破。然而,要讓深度學習在學習如何超越影象、語音及自然語言處理方面做出更多成績,比如對人類情感的理解,意識和動機的模仿,會涉及到很多更深層次的問題,是目前深度學習的黑匣子無法開啟的魔方。
與所有技術的早期發展階段一樣,深度學習技術的發展似乎進入了瓶頸期,它必須克服許多嚴峻挑戰。當前,深度學習所面臨的主要挑戰可以概括為以下幾點:
一、資料匱乏
當代人工智慧主要是由大資料驅動,因而資料可獲得性、資料質量以及資料標註成本等是制約人工智慧發展的一大因素。
深度學習的資料要求與許多維度中的其他分析方法的資料要求大不相同。隨著資料集大小的增加,傳統分析的效能趨於穩定。然而,隨著資料集變大,正確訓練的深度學習技術的效能將顯著提高。
深度學習方法在從複雜的非結構化資料(包括音訊,語音,影象和影片)中提取模式方面特別有價值。要做到這一點,需要成千上萬的資料記錄才能使模型在分類任務中變得更好,並且需要數百萬的資料才能在人類層面上發揮作用。
凡是採用深度學習的地方都對標註資料有很高的依賴,相比人類而言,模型在學習新事物時需要更多的事例。
二、對標註資料依賴性大
我們目前的AI應用程式透過大量資料和深度學習演算法的訓練完成了一件事,即每個應用程式必須使用自己的資料集進行單獨培訓,即使對於與以前類似的用例也是如此。到目前為止,沒有好的辦法將培訓從一種情況轉移到另一種情況。
在實踐中,深度學習體現出對標註資料依賴性大的特點,因此,模型具有領域依賴性,難以做到相互轉移。當深度學習透過標註團隊或眾包經長時間迭代獲得了大規模標註資料,訓練好了模型,可是換了一個業務場景時,模型效果就會一落千丈。
三、不夠透明
目前,深度學習的透明度問題尚未解決。深度學習需要解決其不透明性和黑匣子性質。用人類術語解釋複雜深度學習應用的結果是相當困難的。典型的深度學習系統在其複雜的神經網路中具有大量引數,用人們所理解的方式評估各個節點對決策的貢獻是非常困難的。
在一般情況下,在識別資料集中的貓時,這未必是一個問題。但對於醫療診斷或確定石油鑽井平臺安全性的模型來說,這就是一個相當重要的問題。在此情況下,監管機構希望對模型的透明度有一個良好的瞭解。
此外,在對金融交易等相關領域進行深度學習可能會產生責任,人類使用者可能希望瞭解特定系統如何做出決定,而深度學習的不透明性將會導致嚴重的偏見問題。
四、模型缺乏理解和推理能力
目前深度學習對人類感情的理解還停留在淺層次的語義層面,不具備良好的推理能力,無法真正理解使用者訴求。同時,如何將人類生活常識和背景知識融入模型訓練,也是深度學習需要解決的瓶頸之一。
深度學習的開放式推理能力差(無法基於現實知識進行推理)。
未來的深度學習模型,除了能下圍棋、解方程外,還能寫詩、回答人們的各種常識性問題,才能滿足人們對人工智慧所具有功能的需求。
五、應用場景有限
當前雖然NLP有很多子領域,但是目前發展最好的方向依舊只有分類、匹配、翻譯、搜尋幾種,大部分任務的應用場景依然受限。
閒聊機器人一般作為深度學習問答系統的兜底模組,在FAQ或意圖模組沒有命中使用者提問時回覆一個標準擬人話術。但如果在開放域直接應用閒聊機器人,很容易從人工智慧走向人工智障,或只能得到一個近似的答案。
結語
正如人工智慧領域頂級專家蓋瑞·馬庫斯所指出,關於人工智慧的炒作總是甚囂塵上,但要得到真正可信的AI,卻遠比想象的要複雜得多,超級智慧時代還遠沒有到來。創造真正可信的AI需要賦予機器常識和深度理解,而不是簡單地分析資料。
深度學習作為人工智慧的核心技術,關係到人工智慧技術未來的發展,只有突破深度學習當前所面臨的這一系列瓶頸,克服其侷限性,才能創造出真正可信的人工智慧。
事實上,深度學習是一個好的開始,但是不能解決一切問題,它未來的發展,需要和更高維度的方式疊加。而跨學科的研究會在語義、知識圖譜、機器記憶、想象、邏輯推理等類人腦的領域,彌補深度學習的一些短板。