第一縷星火
人工智慧領域取得了一項重要突破----一在圍棋專案中,一個由谷歌研究團隊開發的計算機系統AlphaGo擊敗了歐洲的頂尖職業棋手。在此之前,這個關於戰略性和直觀判斷的古老東方競技遊戲,已經困擾了人工智慧專家們數十年之久。
AlphaGo系統
DeepMind計劃自稱為「人工智慧界的阿波羅」,於2014年被谷歌收購。在10月倫敦舉辦的這場人機比賽上,DeepMind的系統----一個更廣為人知的名字「AlphaGo」,在與歐洲圍棋冠軍樊麾的對弈中發揮出色,五局比賽未嘗一敗。比賽結果在《自然》雜誌的編輯和英國圍棋聯盟代表的監督和見證下產生,事後《自然》雜誌的編輯評價:這是我職業生涯中最激動人心的時刻之一,無論是作為一名學者還是作為一名編輯。
透過輸入收集到的大量人類棋譜,DeepMind的研究人員開始訓練這個系統自己下圍棋。但這僅僅是第一步。從理論上講,這樣的訓練只會產生一個和頂尖人類一樣優秀的系統(但這不能保證對人類的絕對優勢)。為了打敗最頂尖的人類,研究人員讓這個系統進行自我間對弈。這使得系統自身又可以產生一系列新的棋譜,基於新棋譜訓練出的新人工智慧,有著超越人類大師的能力。
自我增強
深度學習依賴於所謂的神經網路----一種硬體和軟體網路,類似於人腦中的神經元。這些神經網路並非依靠暴力計算或手動制定的規則來運作,他們分析大量資料以「學習」特定的任務。將足夠多的袋熊照片送入神經網路,它可以學習識別袋熊;給它「投餵」足夠多的口語,它可以學會辨認你說的話;「投餵」足夠的圍棋走法,它就可以學會下圍棋。
在DeepMind,研究人員希望神經網路可以透過「看」盤中的選點來掌握圍棋,就像人類在下棋時一樣。這項技術反饋良好,透過將深度學習與「蒙特卡洛樹」方法結合,Facebook旗下的系統已經擊敗了一些人類玩家。
在這之後,研究員們將研究結果輸入第二個神經網路,收集它透過自我對弈給出的建議棋著,神經系統便可以預見這之後的每一步的變化。這類似於較舊的系統(如深藍)在國際象棋領域所表現出的一樣,只不過AlphaGo系統在分析更多資料時,會不斷進行自我學習並最終做到這一點,而非透過暴力的手段探索棋盤上所有的可能性。這樣一來,AlphaGo不僅學會了擊敗現有AI程式,也能學會擊敗頂尖的人類棋手。
風雨欲來
在非公開場合打敗了歐洲的圍棋大師之後,哈薩比斯和他的團隊旨在在公開論壇上擊敗世界頂尖棋手之一的李世石。
根據庫倫等人的說法,戰勝世界冠軍將比戰勝歐洲冠軍樊麾更具挑戰性。但是這次,庫倫將賭注押在了一直以來的競爭對手----AlphaGo上。在過去的十年中,他一直嘗試開發出能夠擊敗世界最頂尖棋手的AI系統,現在,他相信這個系統就在眼前。