A.I.時代來臨,A.I.很熱,我們對A.I.不能視而不見,我們要了解,我們更要學習,我們先來看看A.I.是怎麼回事。
科學界提出“人工智慧”(Artificial Intelligence,縮寫A.I.)這個概念是1956年的夏天,在Dartmouth學院的一個廢棄的小閣樓上,一小撮數學家和科學家在頭腦風暴的時候不知誰腦袋一熱,要組建一個牛逼的科學家小組,目標是花一個夏天的時間讓機器能夠模擬人的行為,具備人的智慧。
然鵝,沒有實現,當時的設想還是基於符號、基於邏輯推理的思路,機器根本無法理解人的推理是如何進行的。很多年過去了,經歷了半個世紀,人們仍舊不停滴探索,什麼基於規則、框架以及邏輯的專家系統(今天倒是成功地應用於拼寫和語法檢查中)、什麼神經網路(30年前,我上大學的時候還曾經有“專家系統”和“神經網路”這兩門課,感覺名字太深奧,也沒有深入瞭解),由於當時缺乏強大的計算力和海量的資料,這些理論探索只是停留Paper上,供科研的資金越來越少,對A.I.的研究越來越冷,只留下孤零零的幾支仍然不屈不撓地探索著如何讓機器像人一樣智慧,人工智慧的研究處於漫長的冬季,只有不斷出現的憂患意識極強、想象力極其豐富的好萊塢的大片 - Terminator、i.Robot、Her....給這些科學家們一些Hope。
突然,2016年,世界冠軍李世石被一隻能自我學習、自我對弈的Alpha狗連續扁了4次以後,人們在媒體的大肆渲染下,猛地發現人工智慧(A.I.)其實在財大氣粗、科技情懷滿滿的科技巨頭的推動下,已經悄悄來到我們的身邊,比如Nest(被Google收購)的智慧溫控器可以根據主人的習慣自動調節室溫;IBM的Watson基於X光片的診斷已經讓幾十年工齡的老醫生擔心自己快下崗了、蘋果的Siri/Amazon的Echo可以聽懂不同方言的人的口語並給出答案、Google的無人駕駛汽車每天穿行在矽谷擁堵的車流裡。
機器已經能夠聽懂我們的方言 - 自從2011年蘋果在iPhone 4S上推出Siri,迄今智慧語音互動技術已經日趨成熟,雖然騙錢、騙地的科大訊飛讓人們對中文語音的互動能力產生了恍惚,但前幾天我們工程師用醇厚的山東口音、語法飄忽的英語指揮Google的Assistant控制連線在樹莓派GPIO上的彩色LED的狀態,毫無爭議地證明了機器對人的語言的解讀能力已經勝過多數人對人自身語言的理解。
機器睜開了火眼金睛 - 無論是蘋果、Facebook、Google、微軟,乃至我國的沒良心企業某度,都具備了在“百萬軍中取上將首級”的能力,於是我們的大街小巷、機場車站都被A.I.賦能的“雪亮的攝像頭”凝視,天網恢恢,疏而不漏。機器視覺也成了最火熱的技術領域,被各色的PPT公司賦予了巨大的財富想象空間。
機器為什麼開始智慧了 ?因為“機器學習”(Machine Learning)了,機器學習中最聰明的一種就是仿生人腦神經結構的“深度學習”(Deep Learning),又叫“深度神經網路”(縮寫DNN)。這種牛逼的演算法怎麼工作的我迄今還沒弄明白,以我僅存的數學基礎實在難以理解,但我知道要讓這種演算法工作,離不開一下三項:
- 足夠的計算能力 - 我們的IC已經接近了摩爾定律的極限,到了薛定諤的貓的狀態,上帝實在看不下去了,即便是一群驢拉磨,還是讓這個磨開始轉動了;
- 海量的資料 - 網際網路搞了20年,移動網際網路也搞了10來年了,網路頻寬到了Gbps、儲存器到了TB,這海量的資料丟進去,讓處理器玩命進行擬合,即便最隨機分佈的數都能讓科學家僅憑腦袋就總結出一堆的統計規律,何況還有這麼超級計算力的機器日夜不停地進行計算;
- 錢 ($ ¥) - 沒錢就沒辦法買速度飛快的計算機系統,還要叢集才能行;沒錢就沒辦法付鉅額的電費讓這些機器晝夜不停地跑,只有富可敵國的資本家才有這麼個財力讓這一切成為可能。
天時、地利、人和基本具備,於是在我們這個幸運的時代,依靠強大的計算力、基於海量的資料、在某些場景下就能夠擬合出一個y=f(x,t)的關係式,這個過程被叫做“訓練”(Training),基於這個訓練過程擬合出來的關係,給定一個輸入量x,系統就告訴你最有可能的結果是y,這個過程叫“推理”。
來,我們看看基於神經網路的機器是如何從一堆照片中把一隻狗找出來的:
當然人類的步伐不只是讓機器聽懂我們、看明白我們,還要讓機器幫我們幹活,尤其是幹體力活,於是各種機器人的研發成了熱點,人們的目標就是讓機器人成為人類的奴隸,只要餵它們點“電”,它們就可以不知疲倦地為我們掃地、端盤子、扛麻袋。。。看看波士頓動力機器人Atlas這妖嬈的跳躍走位,估計不久就可以飛簷走壁、上房揭瓦了,建築工人只需要躺在樹蔭下喝著可樂聽著歌,指揮者這些鋼鐵大力士。
對於A.I.的未來,不同的人有不同的看法,那些行業的超牛比如霍金大神、鋼鐵俠馬斯克都對A.I.的發展持謹慎態度,擔心有朝一日我們人類會毀於這些我們創造的新物種,要防患於未然。
雖然我人微言輕,說了也沒用,但我的觀點還是要表達一下。我個人覺得所謂的A.I.威脅論純粹是杞人憂天,畢竟進化了幾十萬年的人類,腦袋裡的神經網路根本不是幾十億顆晶體管制造的矽片能模擬的;人吃一個饅頭能夠跑幾十公里,機器人背上一坨電池跑半個小時就得倒下,在人類還沒有將E=MC2用起來之前,根本不必擔心機器人會對我們人類有任何威脅,至少在我們的有生之年這個問題不會困擾我。
在這一講裡我們來記住一位牛人 - 加拿大多倫多大學的教授、神經網路的先驅、深度學習的教父級牛人 Geoffrey Hinton,正是他堅持不懈地在神經網路領域的耕耘終於讓微軟、Google在語音處理、影象識別方面有了質的飛躍,從而也燃爆了人們對深度學習的熱情,開闢了人工智慧學習的一條道路,我們不知道這條道路究竟能走多遠,但無論如何,我們人類在認知世界的過程中邁出了大大的一步。
神經網路先驅、深度學習教父 - 多倫多大學教授Geoffrey Hinton
下一講我們將介紹一下資料和演算法在A.I.中的角色和具體應用。
與人工智慧相關的一些技術術語
- 人工智慧(AI) - 廣義上講就是任何能夠透過邏輯、if-then規則、決策樹以及機器學習的方式讓計算機模仿人的智慧的技術;
- 機器學習(Machne Learning,簡稱ML) - 是AI的子集,包含了統計技術能夠讓機器改進有經驗的任務;
- 深度學習(Deep Learning) - 機器學習的子集, 由允許軟體訓練自己執行任務的演算法構成,比如透過多層神經網路處理對大量資料的處理而實現的語音和影象識別;
- 神經網路(Neural Networks) - 模擬大腦中神經元的適應性網路的方式來構建軟體的工作方式,而不是透過人類預先確定的嚴格指令去執行;
- 大資料(Big Data) - 大量資料集用於計算分析,很多是為了揭示模式或趨勢的神經網路;
- 奇點(Singularity) - 一個假設的時間/狀態,在這個點上超級智慧的機器能夠不依賴人的干預開始提升自己;
- 自然語言處理(NPL)- 由計算機執行的語音識別技術,軟體能夠辨識各種方言的人說出的話,並且能夠將口語重造為文字;
- 量子計算(Quantum Computing)- 結合了數字計算和量子物理學的計算方式,它遵從量子位元、疊加等定律,能夠比當前的個人電腦快1億倍。