從學術的觀點看,人工智慧主要分三大學派,分別是符號主義學派、連線主義學派和行為主義學派。在對人工智慧進行研究時,可能會按照某一理論或方法展開探討分析,但在實地落地的專案或產品可能綜合應用了多個學派的知識。比如,最近我們為某製造企業提供智慧客服系統,其中語音識別、語音合成和語義理解技術等屬於連線主義的成果,同時,也使用了知識庫等屬於符號主義的成果。
一、符號主義學派
符號主義,又稱邏輯主義、心理學派或計算機學派,是一種基於邏輯推理的智慧模擬方法,認為人工智慧源於數學邏輯,其原理主要為物理符號系統(即符號作業系統)假設和有限合理性原理。
該學派認為人類認知和思維的基本單元是符號,智慧是符號的表徵和運算過程,計算機同樣也是一個物理符號系統,因此,符號主義主張(由人)將智慧形式化為符號、知識、規則和演算法,並用計算機實現符號、知識、規則和演算法的表徵和計算,從而實現用計算機來模擬人的智慧行為。
其首個代表性成果是啟發式程式LT(邏輯理論家),它證明了38條數學定理,表明了可以應用計算機研究人的思維過程,模擬人類智慧活動。此後,符號主義走過了一條啟發式演算法——專家系統——知識工程的發展道路。
專家系統是一種程式,能夠依據一組從專門知識中推演出的邏輯規則在某一特定領域回答或解決問題。1980年卡內基梅隆大學為數字裝置公司設計了一個名為XCON的專家系統,在1986年之前,它每年為公司省下四千萬美元。專家系統的能力來自於它們儲存的專業知識,知識庫系統和知識工程成為了上世紀80年代AI研究的主要方向。專家系統僅限於一個專業細分的知識領域,從而避免了常識問題,其簡單的設計又使它能夠較為容易地程式設計實現或修改。專家系統的成功開發與應用,對人工智慧走向實際應用具有特別重要的意義,也是符號主義最輝煌的時候。但凡事有利有弊,專家系統僅僅侷限於某些特定情景,且知識採集難度大、費用高、使用難度大,在其它領域如機器翻譯、語音識別等領域基本上未取得成果。日本、英國、美國在80年代初都曾制訂過雄心勃勃的人工智慧研發計劃,如日本的第五代計算機專案,其目標是造出能夠與人對話、翻譯語言、解釋影象,並且像人一樣推理的機器,但直到1991年,這個目標依然未能實現。
20世紀80年代末,符號主義學派開始走向式微,日益衰落,其重要原因是:符號主義追求的是如同數學定理般的演算法規則,試圖將人的思想、行為活動及其結果,抽象化為簡潔深入而又包羅永珍的規則定理,就像牛頓將世間萬物的運動蘊含於三條定理之中。但是,人的大腦是宇宙中最複雜的東西,人的思想無比複雜而又廣闊無垠,人類智慧也遠非邏輯和推理。所以,用符號主義學派理論解決智慧問題難度可想而知;另一個重要原因是:人類抽象出的符號,源頭是身體對物理世界的感知,人類能夠透過符號進行交流,是因為人類擁有類似的身體。計算機只處理符號,就不可能有類人感知,人類可意會而不能言傳的“潛智慧”,不必或不能形式化為符號,更是計算機不能觸及的。要實現類人乃至超人智慧,就不能僅僅依靠計算機。
1997年5月,名為“深藍”的IBM超級計算機打敗了國際象棋世界冠軍卡斯帕羅夫,這一事件在當時也曾轟動世界,其實本質上,“深藍”就是符號主義在博弈領域的成果。
二、連線主義學派
連線主義,又稱仿生學派或生理學派,是一種基於神經網路和網路間的連線機制與學習演算法的智慧模擬方法。連線主義強調智慧活動是由大量簡單單元透過複雜連線後,並行執行的結果,基本思想是,既然生物智慧是由神經網路產生的,那就透過人工方式構造神經網路,再訓練人工神經網路產生智慧。
1943年形式化神經元模型(M-P模型)被提出,從此開啟了連線主義學派起伏不平的發展之路。1957年感知器被髮明,之後連線主義學派一度沉寂。1982年霍普菲爾德網路、1985年受限玻爾茲曼機、1986多層感知器被陸續發明,1986年反向傳播法解決了多層感知器的訓練問題,1987年卷積神經網路開始被用於語音識別。此後,連線主義勢頭大振,從模型到演算法,從理論分析到工程實現,為神經網路計算機走向市場打下基礎。1989年反向傳播和神經網路被用於識別銀行手寫支票的數字,首次實現了人工神經網路的商業化應用。
與符號主義學派強調對人類邏輯推理的模擬不同,連線主義學派強調對人類大腦的直接模擬。如果說神經網路模型是對大腦結構和機制的模擬,那麼連線主義的各種機器學習方法就是對大腦學習和訓練機制的模擬。學習和訓練是需要有內容的,資料就是機器學習、訓練的內容。
連線主義學派可謂是生逢其時,在其深度學習理論取得了系列的突破後,人類進入網際網路和大資料的時代。網際網路產生了大量的資料,包括海量行為資料、影象資料、內容文字資料等。這些資料分別為智慧推薦、影象處理、自然語言處理技術發展做出卓著的貢獻。當然,僅有資料也不夠,2004年後大資料技術框架的行成和圖形處理器(GPU)發展使得深度學習所需要的算力得到滿足。
在人工智慧的演算法、算力、資料三要素齊備後,連線主義學派就開始大放光彩了。2009年多層神經網路在語音識別方面取得了重大突破,2011年蘋果工作將Siri整合到iPhone4中,2012年穀歌研發的無人駕駛汽車開始路測,2016年DeepMind擊敗圍棋冠軍李世石,2018年DeepMind的Alphafold破解了出現了50年之久的蛋白質分子摺疊問題。
近年來,連線主義學派在人工智慧領域取得了輝煌成績,以至於現在業界大佬所談論的人工智慧基本上都是指連線主義學派的技術,相對而言,符號主義被稱作傳統的人工智慧。
雖然連線主義在當下如此強勢,但可能阻礙它未來發展的隱患已悄然浮現。連線主義以仿生學為基礎,但現在的發展嚴重受到了腦科學的制約。雖然以連線主義為基礎的AI應用規模在不斷壯大,但其理論基礎依舊是上世紀80年代創立的深度神經網路演算法,這主要是由於人類對於大腦的認知依舊停留在神經元這一層次。正因如此,目前也不明確什麼樣的網路能夠產生預期的智慧水準,因此大量的探索最終失敗。
三、行為主義學派
行為主義,又稱進化主義或控制論學派,是一種基於“感知——行動”的行為智慧模擬方法,思想來源是進化論和控制論。其原理為控制論以及感知——動作型控制系統。
該學派認為:智慧取決於感知和行為,取決於對外界複雜環境的適應,而不是表示和推理,不同的行為表現出不同的功能和不同的控制結構。生物智慧是自然進化的產物,生物透過與環境及其他生物之間的相互作用,從而發展出越來越強的智慧,人工智慧也可以沿這個途徑發展。
行為主義對傳統人工智慧進行了批評和否定,提出了無須知識表示和無須推理的智慧行為觀點。相比於智慧是什麼,行為主義對如何實現智慧行為更感興趣。在行為主義者眼中,只要機器能夠具有和智慧生物相同的表現,那它就是智慧的。
這一學派的代表作首推六足行走機器人,它被看作是新一代的“控制論動物”,是一個基於感知-動作模式模擬昆蟲行為的控制系統。另外,著名的研究成果還有波士頓動力機器人和波士頓大狗。你可以在網上搜到它們各種炫酷的影片,包括完成體操動作,踹都踹不倒,穩定性、移動性、靈活性都極具亮點。他們的智慧並非來源於自上而下的大腦控制中樞,而是來源於自下而上的肢體與環境的互動。
行為主義學派在誕生之初就具有很強的目的性,這也導致它的優劣都很明顯。其主要優勢便在於行為主義重視結果,或者說機器自身的表現,實用性很強。行為主義在攻克一個難點後就能迅速將其投入實際應用。例如機器學會躲避障礙,就可應用於星際無人探險車和掃地機器人等等。不過也許正是因為過於重視表現形式,行為主義側重於應用技術的發展,無法如同其他兩個學派一般,在某個重要理論獲得突破後,迎來爆發式增長。這或許也是行為主義無法與連線主義抗衡的主要原因之一。
四、總結
綜上所述,我們可以簡略地認為符號主義研究抽象思維,連線主義研究形象思維,而行為主義研究感知思維。符號主義注重數學可解釋性;連線主義偏向於仿人腦模型;行為主義偏向於應用和身體模擬。
從共同性方面來說,演算法、算力和資料是人工智慧的三大核心要素,無論哪個學派,這三者都是其創造價值和取得成功的必備條件。行為主義有一個顯著不同點是它有一個智慧的“載體”,比如上文所說到的“機器狗”的身體,而符號主義和連線主義則無類似“載體”(當然你也可以認為其“載體”就是計算機,只不過計算機不能感知環境)。
人類具有智慧不僅僅是因為人有大腦,並且能夠保持持續學習。機器要想更“智慧”,也需要不斷學習。符號主義靠人工賦予機器智慧,連線主義是靠機器自行習得智慧,行為主義在與環境的作用和反饋中獲得智慧。連線主義和行為主義都使用強化學習方法進行訓練。三者之間的長處與短板都很明顯,意味著彼此之間可以揚長補短,共同合作創造更強大的強大的人工智慧。比如說將連線主義的“大腦”安裝在行為主義的“身體”上,使機器人不但能夠對環境做出本能的反應,還能夠思考和推理。再比如,是否用可以符號主義的方法將人類的智慧儘可能地賦予機器,再按連線主義的學習方法進行訓練?這也許可以縮短獲得更強機器智慧的時間。
相信隨著人工智慧研究的不斷深入,這三大學派會融合貫通,可共同為人工智慧的實際應用發揮作用,也會為人工智慧的理論找到最終答案。
左小波先生,自92年進入IT行業,一直從事著資訊系統的研發及企業IT管理工作,在行業多年的浸潤下,積累了豐富的數字化建設經驗,形成了獨到見解。對人工智慧有著濃厚的興趣,時刻對人工智慧技術保持觀察、學習、思考、分享