Google Brain,中文名為谷歌大腦,谷歌大腦是“Google X實驗室”一個主要研究專案,Google X部門的科學家們透過將1.6萬臺電腦的處理器相連線,建造出了全球為數不多的最大中樞網路系統——谷歌大腦。它是谷歌在人工智慧領域開發出的一款模擬人腦的軟體,這個軟體具備自我學習功能,因此被稱為“谷歌大腦”。
為什麼叫谷歌大腦
谷歌大腦立項於2011年,是谷歌研究員Jeff Dean、Greg Corrado和斯坦福大學教授Andrew Ng之間共同研究的一個專案,可以說谷歌大腦是該公司人工智慧研究部門Google AI內部的深度學習人工智慧研究團隊、開放式機器學習研究與資訊系統以及大規模計算機資源和工具相結合的結果,這為谷歌多個內部人工智慧研究計劃提綱了研究工具,使公眾能夠探索神經網路。
谷歌的深度學習研究由Andrew Ng領導,深度學習需要建立神經網路,這些網路可以複製人腦的功能。這些多層計算機網路,就像大腦一樣,可以收集物品資訊併產生視覺或聽覺感知,同時還會做出相應反應。
谷歌大腦最令人高興的成就之一是當計算機分析數十張影片截圖時,能夠從這些截圖中準確識別出一隻貓。(《紐約時報》的標題:"識別一隻貓要識別多少臺計算機?")正如Ng所解釋的那樣,“系統發現了貓本身的概念(系統透過推演自己理解了“貓是什麼”),因為從來沒有人告訴過它什麼是貓,這是機器學習的一個里程碑。”
Andrew還共同創立了Coursera,它是另一個關注教育行業的人工智慧平臺。Andrew本人是世界上最著名和最有影響力的計算機科學家之一,2012年被《時代》雜誌評為100位最具影響力人物之一,2014年被《快公司》評為最具創造力的人,更不用說他是斯坦福大學的教授。
谷歌大腦的另一位創始人是傑夫·迪恩(Jeff Dean),他是谷歌大腦的早期成員,是一名計算機科學家和軟體工程師。他目前是Google AI的負責人。
Dean在世界各地長大,從明尼蘇達州到夏威夷,再到波士頓、阿肯色州、日內瓦、烏干達、索馬利亞、亞特蘭大都有過他生活的身影,在高中和大學期間,他編寫了世界衛生組織使用的軟體。
谷歌大腦專案變成了谷歌AI產品的孵化器,Google翻譯、BERT語言模型(為Google搜尋提供支援)、TPU(Google授權給客戶並在內部用於一系列生產專案的硬體加速器)和Google Cloud AI都得到了谷歌大腦的支援(將AutoML作為服務出售)。由於拉里·佩奇(Larry Page)渴望與那些想要在"一隻腳踏入行業"的同時做"瘋狂顛覆世界的事情"的人合作,谷歌大腦誕生了(正如佩奇在接受沃爾特·艾薩克森(Walter Isaacson)採訪時所說)。
在傑夫·迪恩(Jeff Dean)撰寫的一篇關於ai.googleblog.com部落格文章中,"我們小組研究文化的一個方面是使研究人員和工程師能夠解決他們認為最重要的基礎研究問題,教育和指導年輕研究人員是我們透過研究工作所做的事情。
谷歌大腦在研究什麼?
正如迪恩所說:"實現谷歌大腦使命的關鍵是在機器學習領域開展新的基礎研究,為此,我們建立了一個蓬勃發展的團隊,進行長期、開放的研究,以推進科學在視覺、聽覺、感知與自然語言的理解,藝術和音樂的生成以及系統架構和演算法等領域進行研究。”
首先,谷歌大腦團隊研究的方向為自然語言的理解,例如谷歌翻譯透過採用一種新的深度學習系統,為谷歌翻譯專案做出了貢獻,該系統將人工神經網路與龐大的多語言文字資料庫相結合,這意味著可以將一種語言的語音直接翻譯成另一種語言的文字,而無需先將其轉錄為文字。
谷歌翻譯於2006年首次亮相,從那時起就成為谷歌最可靠和最受歡迎的資產之一。它每月為超過5億使用者提供超過5億次服務,併為其每天翻譯超過1400億個不同語言的單詞。它不僅作為自己的獨立應用程式存在,而且還作為Gmail或Chrome中的整合功能存在。
其次,谷歌大腦團隊的研究目標之一是透過機器學習來改進機器人技術,並透過機器人技術改進機器學習。透過探索如何教授機器人可轉移的技能,在他們專為機器學習研究而構建的獨一無二的實驗室中並行學習許多操縱手臂。
據迪恩解釋:"我們正在教機器人預測當它們移動物體時會發生什麼,以便了解周圍的世界,並在沒有監督的情況下做出更好、更安全的決策,我們正在公開分享我們的訓練資料,以幫助推進這一領域的技術水平。”
2016年,Google Brain還幫助啟動了一個名為Magenta的專案,這是你在剪輯中看到藝術家使用的平臺。研究藝術與人工智慧的聯絡,以及採用機器學習演算法幫助人們更具創造力的可能性。Magenta正在推動內容製作的生成模型的最先進的技術,從音樂和圖片生成開始,然後轉向文字生成和虛擬現實等領域。
此外,谷歌大腦的目標之一直就是更好地理解語言。很多工作都涉及訓練神經網路模型,其中一個專案是Duplex。根據ai.googleblog.com將雙工描述為"一種新技術,用於進行自然對話,透過電話執行'現實世界'任務。該技術旨在完成特定任務,例如安排某些型別的約會。該技術使此類工作的對話體驗儘可能自然,允許使用者自然地說話,就好像他們正在與另一個人交談一樣,而無需嘗試適應計算機。
Google雙工技術旨在看起來自然,並提供愉快的對話體驗。Google Duplex技術可以進行復雜的對話,並完全自主地完成其大部分職責,而無需人工干預。
另外一個研究領域是機器感知。這需要使用計算機來檢視我們周圍的世界,以及分析,建模和處理視覺,音訊和多模態資料。在谷歌,機器感知仍然是一個研究領域,具有巨大的潛力,對我們的日常生活有益。
從谷歌之前展示的影片中可以看出,這是一個使用機器感知的應用程式,演示瞭如何使用移動視覺,面部,條形碼,文字API。首先,應用程式掃描線上廣告中的QR碼,將使用者直接帶到產品頁面。然後使用者使用面部API虛擬試用產品,在這種情況下,產品是太陽鏡。最後,使用者使用文字 API 掃描信用卡進行支付。目前,谷歌已經看到使用神經網路的機器感知方面取得了巨大進展,體積壓縮,學習影象壓縮和影片壓縮已經取得了良好的效果。
最後,谷歌大腦團隊建立了一個名為PAIR Initiative People + AI Research的專案。它的使命是研究和建立人類參與人工智慧技術的最有效方法。PAIR致力於解決各種問題,其中一些我們已經提到過:透過可解釋性工作幫助來自各個領域的學者和從業者,包括計算機科學,設計,甚至藝術研究人員理解機器學習系統,都是PAIR工作的一部分。
谷歌大腦 vs DeepMind
對於那些想了解谷歌大腦的人來說,谷歌大腦和DeepMind是不一樣的。
谷歌大腦是谷歌內部從2011年開始孵化的一個人工智慧專案,它曾經是谷歌內部主要的人工智慧研究工作,而DeepMind則是一家英國人工智慧初創公司,於2014年被谷歌收購。
“雖然谷歌大腦和DeepMind都是研究實驗室,然而,谷歌大腦在許多領域都有更強的應用重點、研究論文,而DeepMind的重點是強化學習,他們有旗艦產品,如AlphaGo Zero,這是實現人工通用智慧的先鋒。”一位曾在DeepMind和谷歌大腦工作過的員工描述了兩家公司的組織結構。
最後,迪恩在Google AI部落格中撰寫的一篇名為《Google Research》的文章中揭示了谷歌大腦的詳細情況:"我們很自豪能夠熱情地支援和參與更廣泛的研究社群。2020年,谷歌大腦研究人員在領先的研究會議上發表了500多篇論文,此外還擔任了專案委員會的成員,組織了研討會,教程和許多其他活動,旨在共同推進該領域的最新技術......2020年,我們以3700萬美元的資金支援外部研究,其中包括850萬美元的COVID研究,800萬美元的研究包容性和公平性,以及200萬美元的負責任的人工智慧研究。”
對於未來,迪恩在另一篇文章中表示,團隊的重點將放在促進研究誠信、負責任的人工智慧開發、推進多元化、公平性和包容性三個方向上。它表示:“谷歌大腦團隊熱衷於確保建立有影響力的產品和計算系統的個人更好地反映世界各地使用它們的人,將尋求更多學術和工業合作伙伴的幫助,以推動這些舉措,這些舉措將在Google翻譯內部以及更大的研究和學術社群中進行。谷歌將繼續研究新的機器學習演算法,使機器學習更加高效和可訪問,以及打擊語言模型中不公平偏見的方法,發明新的策略來保護學習系統中的隱私等等。”