猜測未來可能發生什麼是一回事,面對已經發生的事實是另一回事。
AI的溝通能力
人類智慧的一種能力就是心靈感應。一個大腦中的想法可以透過空氣中的振動傳播,在附近的其他大腦中產生類似的想法。
這就是語言的魔力。透過寫作,這種能力進一步增強,使大腦能夠與數千年後的未來或地球另一端的其他人分享想法。
你螢幕上的塗鴉正在表演這一魔術的壯舉。
語言包含不同的功能:轉錄(將聲音轉化為單詞)、翻譯、理解和給出回應、語音合成(將單詞轉化為聲音)。
轉錄
語音轉錄,也被稱為語音識別,將口語單詞轉換為文字。
早期的轉錄軟體早在20世紀80年代就已經存在了,但以今天的標準來看,它還是很原始的。最初的版本需要對每個說話者進行語音訓練,詞彙量有限,說話者在每個單詞之間必須停頓。
但在2016年,微軟的人工智慧和研究部門構建了首個語音識別技術,其準確性超過了人類轉錄員。
人類處理一組記錄的錯誤率為5.9%。微軟的系統差之毫釐地降低了錯誤率。
截至2020年,Dragon NaturallySpeaking最新的商業版支援每分鐘160詞,無需訓練,準確率高達99%。
翻譯
現代人工智慧具有驚人的語言翻譯能力。
谷歌翻譯支援超過100種語言,完全自學。
谷歌的工程師們建造了一個可以自我學習的人工智慧,而不是手工程式語言翻譯規則。它被稱為谷歌神經機器翻譯(GNMT)。
工程師們提供了由聯合國和歐洲議會出版的GNMT樣本翻譯。正如人類從羅塞塔石碑上的例子中學會了破譯古埃及語一樣,GNMT也學會了如何在101種人類語言之間進行翻譯。
世界上最精通多種語言的人類只會59種語言。
理解
理解是提取文字所傳達意思的能力。
2019年,OpenAI的工程師們取得了如此大的成功,以至於他們被自己的創造嚇到了。他們認為他們的人工智慧非常危險,他們說將其釋出給公眾是不負責任的。
這些工程師創造了一種名為生成預訓練變壓器2或GPT-2的人工智慧。
人工智慧有一個簡單的任務:給定一個輸入文字,預測接下來最有可能出現的單詞。
在訓練了80億個文件(包含40gb)的英語文字後,GPT-2顯示出了驚人的能力:GPT-2可以創造出連貫的文字。此外,GPT-2展示了閱讀理解能力。它甚至可以總結和回答關於輸入文字的問題——儘管沒有受過這方面的訓練!
對於任何提示,GPT-2都可以根據需要生成儘可能多或儘可能少的附加文字。例如,在提到“今天”一詞時,GPT-2繼續說:“今天,聯合國呼籲立即從世界上撤出所有核武器。”
GPT-2甚至可以寫一篇完整的文章,包括來自科學家的假引用。這款人工智慧展示了對世界地理的理解,甚至還展示了世界不同地區使用的命名慣例。
研究人員給GPT-2提供了這樣的提示:“在一個令人震驚的發現中,科學家發現了一群獨角獸,生活在安第斯山脈一個偏遠的、以前沒有探索過的山谷中。更讓研究人員驚訝的是,獨角獸能說一口流利的英語。”
他們要求GPT-2從那裡繼續。以下是人工智慧生成的文字:
The scientist named the population, after their distinctive horn, Ovid’s Unicorn. These four-horned, silver-white unicorns were previously unknown to science.
Now, after almost two centuries, the mystery of what sparked this odd phenomenon is finally solved.
Dr. Jorge Pérez, an evolutionary biologist from the University of La Paz, and several companions, were exploring the Andes Mountains when they found a small valley, with no other animals or humans. Pérez noticed that the valley had what appeared to be a natural fountain, surrounded by two peaks of rock and silver snow.
Pérez and the others then ventured further into the valley. “By the time we reached the top of one peak, the water looked blue, with some crystals on top,” said Pérez.
Pérez and his friends were astonished to see the unicorn herd. These creatures could be seen from the air without having to move too much to see them – they were so close they could touch their horns.
While examining these bizarre creatures the scientists discovered that the creatures also spoke some fairly regular English. Pérez stated, “We can see, for example, that they have a common ‘language,’ something like a dialect or dialectic.”
Dr. Pérez believes that the unicorns may have originated in Argentina, where the animals were believed to be descendants of a lost race of people who lived there before the arrival of humans in those parts of South America.
While their origins are still unclear, some believe that perhaps the creatures were created when a human and a unicorn met each other in a time before human civilization. According to Pérez, “In South America, such incidents seem to be quite common.”
However, Pérez also pointed out that it is likely that the only way of knowing for sure if unicorns are indeed the descendants of a lost alien race is through DNA. “But they seem to be able to communicate in English quite well, which I believe is a sign of evolution, or at least a change in social organization,” said the scientist.
這位科學家以它們獨特的角命名了這個種群,奧維德獨角獸。這些四角的銀白色獨角獸以前是科學界所不知道的。
兩個世紀後的今天,這一奇怪現象的起因之謎終於解開了。
拉巴斯大學的進化生物學家豪爾赫Pérez博士和幾個同伴在探索安第斯山脈時,發現了一個沒有其他動物或人類的小山谷。Pérez注意到山谷裡似乎有一個天然的噴泉,被兩個岩石和銀雪的山峰環繞著。
Pérez和其他人繼續冒險進入山谷。“當我們到達一個山頂的時候,水看起來是藍色的,上面有一些水晶,”Pérez說。
Pérez和他的朋友們看到獨角獸群都很驚訝。從空中就可以看到這些動物,不用移動太多就能看到它們——它們離得如此之近,以至於可以觸控到它們的角。
在研究這些奇怪的生物時,科學家們發現這些生物也會說一些相當普通的英語。Pérez表示,“例如,我們可以看到它們有共同的‘語言’,類似於方言或辯證法。”
Pérez博士認為,獨角獸可能起源於阿根廷,那裡的動物被認為是一個已經消失的種族的後代,這個種族在人類到達南美洲的這些地區之前就生活在那裡。
雖然它們的起源仍不清楚,但一些人認為,也許這種生物是在人類文明出現之前,人類和獨角獸相遇時創造出來的。據Pérez網站報道,“在南美,這類事件似乎很常見。”
然而,Pérez也指出,確定獨角獸是否確實是一個消失的外星種族的後代的唯一方法可能是透過DNA。這位科學家說:“但它們似乎能很好地用英語交流,我認為這是進化的標誌,至少是社會組織的變化。”
雖然故事並不完美,但 GPT-2 將安第斯山脈的提示與阿根廷、拉巴斯大學和西班牙名字 Jorge Pérez 聯絡起來,全部靠自己。AI 還選擇 Pérez 作為進化生物學家。
OpenAI 認為一個可以生成虛假故事的系統有可能被濫用。
由於我們擔心該技術的惡意應用,我們不會發布經過訓練的模型。作為負責任披露的實驗,我們釋出了一個更小的模型供研究人員進行實驗。
OpenAI
創作者擔心他們的技術會被利用來製造假新聞或生成垃圾郵件。
特里斯坦·格林說:“我害怕GPT-2,因為它代表了一種邪惡的人類將用來操縱人的技術,在我看來,這使它比任何槍支都更危險。”
在OpenAI和更廣泛的社群進行了九個月的辯論後,OpenAI改變了它的決定。GPT-2現在對公眾開放,任何人都可以下載和使用。
任何人都可以在網上試用它:talktotransformer.com。
把這一切放在一起
在一個令人震驚的例子中,谷歌Assistant背後的工程師將所有這些技術整合在一起。其結果是一種名為Duplex的人工智慧。Duplex可以自己打電話給沙龍和餐廳進行預訂。
谷歌助理很快就能打電話給餐廳為您預訂
2018年,谷歌Assistant結合了自然語言的許多方面,可以透過電話安排約會。
Duplex被告知“在週二上午10點到12點之間的任何時間安排理髮。”
Duplex打電話給當地的一家美髮沙龍,並與電話另一端的人進行了如下對話:
(Ring)
Person: Hello, how can I help you?
Duplex: Hi, I’m calling to book a women’s haircut for a client. Umm.. I’m looking for something on May 3rd.
Person: Sure, give me one second.
Duplex: Mm-hmm.
Person: Sure, what time are you looking for around?
Duplex: At 12:00 PM.
Person: We do not have a 12:00 PM available. The closest we have to that is a 1:15.
Duplex: Do you have anything between 10:00 AM, and uhh, 12:00 PM?
Person: Depending on what service she would like. What service is she looking for?
Duplex: Just a woman’s haircut, for now.
Person: Okay, we have a 10 o’clock.
Duplex: 10:00 AM is fine.
Person: Okay what’s her first name?
Duplex: The first name is Lisa.
Person: Okay perfect. So I will see Lisa at 10 o’clock on May 3rd.
Duplex: Okay great, thanks.
Person: Great. Have a great day. Bye.
Duplex 結合了許多語言技術,包括轉錄、理解和語音合成。結果是一個電話,這個人不知道他們在和人工智慧說話。
我們可以認為這是圖靈測試的透過。
AI的學習能力
DeepMind成立於 2010 年,其使命是“理解並重新創造智慧本身”。
到 2013 年,DeepMind 已經做出了通用的學習演算法。為了證明這一點,他們將它設定為玩舊的 Atari 影片遊戲——它以前從未見過的遊戲,也沒有被告知如何玩。
影片遊戲
AI可以看到螢幕,它有一個控制器。它被告知要做的唯一一件事就是儘可能得最高分。一開始,它玩起來就像小孩子玩遊戲一樣,隨機按下控制鍵,很快就輸了。
但不久之後,情況有所改善。在玩了10分鐘的划槳遊戲《Breakout》後,AI可以多次擊中球,然後才失手。
經過兩個小時的遊戲,它已經學會了像人類最好的玩家一樣玩遊戲。
工程師們決定讓這個系統持續運轉一夜。
幾個小時後,當他們檢視程序時,他們驚訝地發現,系統發現了在某些遊戲中獲勝的新策略。在測試的7款遊戲中,他們的AI在其中6款遊戲中擊敗了之前所有的AI,並在其中3款遊戲中學會了比任何人類玩家玩得更好。
這一成就令谷歌印象深刻,他們決定在2014年以超過5億美元的價格收購DeepMind。
DeepMind繼續研究他們的學習演算法。到2015年,他們的系統可以以超人的水平學習如何玩 49 個測試遊戲中的一半多。但在某些比賽中,它的表現仍落後於人類選手。有些東西阻礙了AI的發展。
到2020年,工程師們發現了缺失的元素:好奇心。在學習演算法中加入好奇心後,最新的人工智慧Agent57學會了如何玩所有57款雅達利遊戲,比任何人類都好。
在DeepMind在雅達利(Atari)遊戲上取得成功後,他們將注意力轉向了古老的棋類遊戲圍棋(Go)。
棋盤遊戲
圍棋不僅是最古老的棋盤遊戲,也是最複雜的。每回合的可能移動數如此之多,以至於之前所有構建強大圍棋AI的嘗試都以失敗告終。
DeepMind的工程師們認為,他們的學習演算法可能會在別人失敗的地方取得成功。他們設計了一個可以透過自己玩來學習的圍棋AI。他們稱之為AlphaGo。
到2016年,DeepMind估計AlphaGo已經強大到足以擊敗世界上最優秀的人類棋手——這是一個從未有人做到的壯舉。為了證明這一點,谷歌組織了一場AlphaGo和世界圍棋冠軍李世石的比賽。圍棋在亞洲很受歡迎,圍棋比賽被大量電視轉播。
超過2億人收看了比賽,是超級碗的兩倍。
儘管AlphaGo滿懷信心地進入比賽,但在5局比賽中,有4局擊敗了李世石。
一年後,DeepMind開發了一款通用AI,用於學習翫棋盤遊戲,除了遊戲規則外,不提供任何資訊。因為它從零知識開始,他們叫它AlphaZero。
AlphaZero可以學習任何給定規則的遊戲。當提供國際象棋規則時,AlphaZero在短短四個小時內就學會了比任何人類都玩得好!在早餐和午餐之間的時間裡,AlphaZero重新發現了人類象棋大師花了幾個世紀才找到的所有共同的突破口。
AlphaZero不僅學會了比人類更高水平的國際象棋,而且比最好的人類程式象棋系統還要好。
你可以說AlphaZero不僅學會了如何比人類更好地下國際象棋,它還學會了如何給計算機程式設計,讓它比任何人類程式設計團隊都更好地下國際象棋。
我一直想知道如果一個優秀的物種降落在地球上並向我們展示他們是如何下棋的。現在我知道了。
國際象棋大師彼得海涅尼爾森談 AlphaZero
因為它從頭開始學習一切,AlphaZero 的遊戲風格是獨一無二的。DeepMind 創始人德米斯·哈薩比斯 (Demis Hassabis) 本人曾是國際象棋神童,他說:“這就像來自另一個維度的國際象棋。”
2018 年,經過 30 小時的自我對弈,AlphaZero 學會了如何比 AlphaGo 更好地下圍棋,並以 100-0 擊敗了它。
這種發展對李世石來說太過分了。2019年,他宣佈退出圍棋,他說“即使我成為第一,也有打不敗的存在。”
部分資訊遊戲
棋類遊戲與我們所處的動態和不可預知的世界相去甚遠。在國際象棋和圍棋中,棋手對一切都瞭如指掌。整個板總是可見的。沒有未知。
然而,在現實世界中,我們不得不面對部分和不完整的資訊。考慮到我們的不確定性,我們必須根據猜測、直覺和信念來行動。
AI已經在擁有完整資訊的遊戲中證明了自己。它能否在更貼近現實世界的遊戲中獲得成功?有許多演員、未知變數和不斷變化的遊戲?
機器能發展直覺嗎?
Facebook人工智慧和卡內基梅隆大學(Carnegie Mellon University)的一個聯合團隊旨在找出答案。
他們選擇了一個不確定性、部分資訊和直覺占主導地位的遊戲:撲克。
他們想要創造出第一個能夠在《德州撲克》(Texas Hold’em)最流行、最困難的版本中擊敗職業撲克玩家的AI。
之前的ai在一對一遊戲或極限撲克遊戲中都很成功,但沒有極限撲克以及同時有多個對手會讓遊戲變得更加複雜。沒有人在這裡成功過。
在撲克遊戲中,玩家只知道一部分牌。對手手中的牌直到比賽結束才會出現。欺騙變成了一種必要的虛張聲勢的策略——假裝自己的手比自己真正握有的手更有力。
團隊採用了AlphaZero的策略。他們的人工智慧叫Pluribus,不需要外界的指導,它可以透過與自己對抗來自學遊戲。
在7個小時內,Pluribus學會了像普通人一樣玩撲克。20小時後,它達到了人類職業選手的水平。研究人員讓它繼續下去。8天之後,團隊相信Pluribus已經達到了超人級別的撲克水平。
為了證明這一點,他們在Pluribus和人類職業撲克玩家之間組織了一場比賽。每個人類玩家都是世界上最好的玩家之一——他們都透過玩撲克贏得了100多萬美元。
Pluribus 決定性地獲勝。 它在一週內學到的關於撲克的知識比人類玩了一個世紀的還多。
Pluribus 是一個很難對付的對手。很難確定他是哪隻手。
克里斯·弗格森,六次世界撲克系列賽冠軍,輸給了Pluribus
Facebook AI 的 Noam Brown 談到 Pluribus 時說:“它比任何人都更能虛張聲勢。”
即時遊戲
雖然撲克和現實世界一樣,也有隱藏的資訊。它仍然像棋類遊戲,因為它是回合制的。在回合制遊戲中,玩家只需要決定如何行動,而不需要決定何時行動。
但現實世界是動態的,變化是永恆的。我們不僅要決定如何行動,還要決定何時行動。我們也不能直接知道別人在做什麼或做過什麼。
象棋、圍棋和撲克等遊戲完全沒有這種“實時”屬性,但它卻是其他遊戲型別的核心元素,如實時策略遊戲和射擊遊戲。
在價值2400萬美元的“電子競技超級碗”電子遊戲錦標賽上,OpenAI出人意料地向人類頂級玩家Danylo Ishutin發起挑戰,讓他與自己的AI進行較量。
人工智慧被訓練去玩即時策略遊戲Dota 2。
在比賽中,AI打敗了Ishutin,他懇求AI“請不要再欺負我了。”
2018 年,DeepMind 在 AI 學習翫射擊遊戲方面取得了類似的進展。 這些遊戲涉及個人在 3D 環境中合作的戰術和策略。 DeepMind 的 AI 在 Quake III 中達到了超人的遊戲水平。
2019 年,DeepMind 創造了一個名為AlphaStar的人工智慧,它學會了玩即時戰略遊戲星際爭霸 II。它在 10 場比賽中有 10 場擊敗了排名第一的人類玩家。
超越遊戲
AI在遊戲中取得了令人難以置信的成績。但它有多有用呢?一個能玩超人類水平的國際象棋或星際爭霸的人工智慧是無法治癒癌症或拯救世界的。
但通用學習演算法的用途非常廣泛。它們可以應用於遊戲之外的許多領域。例如,谷歌的GNMT學會了如何翻譯語言,這可以幫助旅行者在外國旅行。
DeepMind的最新專案之一是一款名為AlphaFold的人工智慧。AlphaFold正在學習如何解決蛋白質摺疊這一極其複雜的問題——如果解決了這個問題,它將用於開發藥物、基因療法,甚至可能治癒癌症。
在最近的一篇論文中,AlphaFold在預測蛋白質摺疊方面取得了比以往任何方法都更高的準確性。
AlphaZero的創造性見解,加上我們在AlphaFold等其他專案中看到的令人鼓舞的結果,讓我們對建立通用學習系統的使命充滿信心,該系統有朝一日將幫助我們找到一些最重要和複雜的科學問題的新解決方案。
DeepMind 團隊
2016年,DeepMind將他們的演算法應用於資料中心的冷卻問題。結果是:人工智慧能夠將冷卻費用削減40%。
學習演算法也可以在實現人類和超人智慧方面發揮關鍵作用。因為我們不需要弄清楚如何構建成人的大腦——我們只需要弄清楚如何構建嬰兒的大腦。從那裡,AI可以學習其他一切。
AI的移動能力
動物和靜止的生命形式之間最明顯的區別是,我們可以在不斷變化的環境中導航。這需要不斷獲取資訊來決定如何從A點到B點,同時避開飢餓的捕食者。
你可以說,我們之所以有大腦是因為我們會移動。有一種動物就證明了這一點。
一旦它安定下來,海鞘就會“吃掉”自己的大腦。
海鞘在其幼蟲階段會游泳,但它沒有消化系統。在它吃東西之前,它必須在海底找到一個合適的地方來附著自己,開始蛻變。當它從這個過程中出現時,它有嘴巴和消化系統,但它的感覺器官和大部分大腦都消失了!
一旦附著,幼年成蟲就不再需要感覺器官、神經弦甚至尾巴,所以它會重新吸收它們。大腦囊泡被轉化成一個大腦神經節,它只幫助靜止的成年動物進食。
約翰·畢曉普
為了在現實世界中取得成功,人工智慧還必須掌握動態環境中的運動。
這方面已經取得了很大進展。人工智慧現在在地面和空中飛行器的控制方面達到了超人的效能。此外,它還掌握了對身體的精細運動控制。
駕駛
如今的人工智慧系統比普通人類的駕駛技術更好。他們受益於毫秒級的反應時間,360度的視野,而且從不分心、疲倦或醉酒。
谷歌從2009年開始開發自動駕駛汽車,目標是10年創造世界上最好的司機。
到 2014 年,谷歌的自動駕駛汽車已經行駛了超過 700,000英里,並且沒有造成任何事故。
人類司機在一生中只能從一個角度獲得經驗。
AI系統不受此限制。每一輛自動駕駛汽車的資料可以結合起來,形成一個共享的經驗池,從中吸取教訓。這一全新體驗將創造出更棒的AI。
有100萬輛人工智慧汽車在路上行駛,它每年都能獲得100萬年的駕駛經驗。它會知道這個國家的每條路,在各種天氣條件下如何駕駛,它會有每天避免數十起事故的習慣。沒有一個人類司機能像他那樣有經驗。
飛行
除了地面車輛,谷歌還在Project Wing下開發無人機。
Wing的目標是無人機交付。目前這款無人機正在澳大利亞進行測試,人們可以透過一款應用下單食品和飲料。2019年,Project Wing成為首家獲得美國聯邦航空管理局(Federal Aviation Administration)航空運營證書的無人機送貨公司。這使得Wing可以作為一家商業航空公司在美國領空運營。
在軍事航空界,戰鬥機飛行員是精英中的精英——他們的生命依賴於此。
吉恩·李(Gene Lee)是一名擁有數十年經驗的前戰鬥機飛行員。他曾飛行和指揮過數千次空中攔截任務,是美國空軍的戰鬥經理和對手戰術指導員。
吉恩·李幾十年來一直在飛行模擬器中對抗人工智慧對手。但在2016年,他遇到了自己的對手:一名名為阿爾法的人工智慧飛行員在每次遭遇中都擊落了吉恩·李。幸運的是,這只是一次模擬。
用他的話說,阿爾法是“迄今為止我見過的最具侵略性、反應迅速、動態和可信的人工智慧。”
我對它的意識和反應感到驚訝。它似乎意識到我的意圖,並對我飛行和導彈部署的變化做出了即時反應。它知道如何擊敗我的發射。它可以根據需要在防禦和進攻之間迅速切換。”
Gene Lee,退休的美國空軍上校
靈活的機器人
人工智慧可以駕駛和飛行車輛,但它能駕駛像人類這樣擁有數百塊肌肉和關節、需要持續保持平衡的身體嗎?一家名為波士頓動力的公司已經證明了這一點。
他們製造了一個名叫Atlas的機器人,有著人形的身體。它是兩足動物,像人一樣移動。它可以透過困難的地形和障礙。
在最近的一次演示中,波士頓動力公司展示了Atlas的更多功能。它能跑、跳、做後空翻、側手翻、倒立和翻筋斗。它表演的特技很少有人能做到。
AI的識別能力
人類的大腦是一個模式識別機器。哺乳動物大腦最進化的部分是它的外層,被稱為皮層。在人類中,30%的大腦皮層用於處理視覺資訊。
視覺系統負責接收視網膜細胞接收到的閃爍的光,並構建我們所知道的豐富的3D世界——一個充滿了物體、人和意義的世界。
雖然感覺是自動的,但你的數十億神經元在幕後工作,使它發生。
製造一臺能複製我們最複雜的感覺系統功能的機器不是一件小事。製造出能夠確定人、地點和事物的光的圖案。
這些光的模式,畫素的網格,最終只是一系列的數字:這裡的紅光強度,那裡的綠光強度,等等。這不僅適用於計算機,也適用於大腦。大腦只能看到來自視神經的突觸訊號的數量——每條視神經包含100萬根神經纖維。
斯坦福視覺實驗室和普林斯頓大學建立了ImageNet——一個包含1400萬張註釋影象的集合,涵蓋了2萬個類別。該資料集用於訓練系統的目標識別。
自2010年以來,ImageNet大型視覺識別挑戰賽(ImageNet Large Scale Visual Recognition Challenge)讓參賽隊伍比賽,看誰能根據自己的資料集構建出最好的物體識別系統。
第一年的結果糟透了。
獲勝團隊的錯誤率為26%,是人為錯誤率的5倍。
進展緩慢,但穩定。到2015年,也就是比賽開始後僅僅五年,微軟研究院就建立了一個超過人類準確度的系統。錯誤率僅為4.94%。
截至2020年,頂級系統的錯誤率為1.3%。
微軟在網上展示了他們的影象識別技術。谷歌甚至可以讓你上傳自己的照片,並讓他們的人工智慧處理它們。
谷歌的物件識別應用於圖片。請注意,AI 會突出顯示圖片中大象所在的區域。
值得注意的是,這些人工智慧不是手工程式設計的。相反,他們會以身作則。
人工智慧並沒有被告知尋找哪些屬性來區分貓和狗。相反,AI被給予許多貓和狗的例子,並被告知哪個是哪個。人工智慧可以自己學習貓和狗的特徵。
AI的創造能力
人類的一個決定性特徵是我們的創造力。我們有能力提出新的想法,並表現出獨創性。我們運用我們的創造力去創造藝術、音樂和發明。
創造性:對想象力或原創想法的運用,尤指在藝術作品的創作中。
機器能有創造精神或想象力嗎?
機器的原始想法聽起來很矛盾——機器是由人類設計和程式設計的。我們告訴他們該做什麼。那麼機器怎麼可能有創造力呢?
儘管存在表面上的矛盾,但已經制造出了在創造性領域挑戰人類的機器。現在有擅長創造藝術的機器。機器已經構想出了值得申請專利的發明。可以說,一些機器甚至顯示出了它們的想象力。
這些努力催生了人工智慧的一個新領域——計算創造力。
藝術
2017年,伯克利大學人工智慧研究實驗室的一個團隊創造了一個名為cyclgan的影象翻譯系統。經過訓練,它可以把馬變成斑馬,或者把冬天的景色變成夏天。
CycleGAN 的創造者更進一步。他們決定以各種印象派畫家的風格訓練人工智慧。訓練完成後,他們向 AI 提供一張照片,並要求它生成克勞德·莫奈、文森特·梵高、保羅·塞尚或日本浮世繪風格的畫作。
他們的結果令人難以置信:提供給 AI 的任何影象都被轉換為莫奈或梵高風格的畫作。
但這個人工智慧只是學會了複製其他藝術家的風格。這可能需要技巧,但是涉及到什麼創造力呢?一個真正有創意的人工智慧會形成自己的風格。
這正是羅格斯大學藝術與人工智慧實驗室主任 Ahmed Elgammal 旨在解決的挑戰。他創造了一種新型人工智慧,他稱之為創意對抗網路或 (CAN)。CAN 的目標是創造新奇事物:例如風格不同於以往的藝術作品。
因此,由 CAN 製作的藝術品傾向於抽象作品。Elgammal 說:“我每次執行它時都會對輸出感到驚訝。” 以下是 AI 創作的示例。
Elgammal 的 Creative Adversarial Network 生成的一些藝術作品。
我們測量了對人類藝術和機器藝術的反應差異,發現差異很小。實際上,有些人更受機器完成的藝術的啟發。
艾哈邁德·埃爾加馬爾
我們無需懷疑有一天人類藝術家是否將不得不與機器競爭。那一天已經過去了。2018 年,佳士得拍賣行成為第一個上架人工智慧創作的藝術品的拍賣行。
這幅肖像拍出了 432500 美元——是估價的 45 倍!
“Edmond De Belamy 的肖像”是由人工智慧生成的。
使用人工智慧進行藝術創作的Hugo Caselles-Dupré表示:“我們發現,肖像是闡明我們觀點的最佳方式,也就是演算法能夠模仿創造力。”
音樂
音樂表達並非人類獨有。鯨魚和鳥也唱歌。但是人工智慧能夠創造音樂嗎?
2017年,微軟的一個團隊創造了巴赫機器人(BachBot)——一種接受訓練的人工智慧,可以按照約翰·塞巴斯蒂安·巴赫(john Sebastian Bach)的風格作曲。為了測試它,研究人員建立了一個網站,BachBot.com,在那裡人們可以聽樣本並猜測它是由巴赫還是BachBot創造的。
在2336名參與者中,能夠分辨出巴赫機器人和真實巴赫的人只比隨機猜測的結果高出1%。換句話說,人們在分辨BachBot和真實的東西上的能力微不足道。你可以在BachBot.com上自己嘗試一下。
作為一個做音樂的人,程式碼可以做我做的事情的想法是很奇怪的。一想到演算法可以在幾分鐘內製作出一首不那麼糟糕的歌曲,而人工智慧正在進入我們認為是人類特有的創造性領域,就會讓人感到不安。
達尼·迪爾,The Verge雜誌的作家
人工智慧在音樂領域的應用越來越多,可以用於歌詞、旋律的創作,甚至可以預測音樂作品的銷量。
有一個線上演示版本允許你使用AI生成不同主題、體裁和音調的歌詞。當提到貓這個話題,加上流行的型別和快樂的情緒,它會產生:
Verse 1
You rise so that you embrace me
Like a cat downs the cat with the nose up
He got this cat, he got this cat
He got this cat, he came homePre-Chorus
I wish I was a cat that can do all the things a cat can do
I wish I was a cat that can leap from the ceilingChorus
So how did you manage to open up my heart, and still feel so alone
The snow is falling, and my cat is hiding
From a storm inside my heart from not sleeping
And cats with silver chains
最近的證據表明,人工智慧甚至已經對音樂產生了興趣。至少,它似乎瞭解人類會喜歡某段音樂的程度。
初創公司Hyperlive聲稱已經建立了一種人工智慧,可以以 83% 的準確率預測銷售資料。
AI 用黃色預測銷售資料,用白色預測實際銷售資料。
他們的系統預測了 10 位主要藝術家的 200 首曲目的銷售資料。他們的技術透過對音樂在聽者大腦中引起的“神經、生理和行為反應”進行建模來發揮作用。
鑑於其準確性,我們必須懷疑機器是否具有美感。
想像力
想象力是一種憑空產生新的想法和意象的能力。
在過去的幾年裡,機器的想象能力不僅提高了,而且在很短的時間內大大超過了人類的想象力,至少在準確性和現實性方面是這樣的。
舉個例子,下面是一張人的照片。這個人可能看起來很真實,但實際上她並不存在。她從未出生,也從未停下來拍照。她的眼睛裡沒有思想和靈魂。
一個由人工智慧想象出來的不存在的人。圖片來源:thispersondoesnotexist.com
照片和人物是由人工智慧想象出來的。透過訪問thispersondoesnotexist.com網站即時建立。你也可以訪問這個網站並重新整理它,以獲得無窮無盡的不存在的人的照片。
DeepMind將這項技術擴充套件到了人臉之外。它有能力創造出乳酪漢堡、狗、蝴蝶和風景的現實圖片。
也有一些人工智慧可以受到啟發去想象。一種是將貓、建築或鞋子的草圖轉化為照片的真實感。另一種人工智慧將文字描述轉換為影象:
根據文字描述生成的花鳥照片。圖片來源:生成對抗文字到影象合成
這項技術已經從照片發展到影片領域。
它可以用來替換電影中的演員,比如在《終結者2》中用西爾維斯特·史泰龍替換阿諾德·施瓦辛格,或者流行的讓尼古拉斯·凱奇出現在每部電影中。
利用最新的技術,人工智慧可以拍攝一張照片,並透過預測未來將其變成現實。麻省理工學院(MIT)人工智慧實驗室(AI Lab)的一個團隊訓練人工智慧從一張圖片中預測接下來幾秒鐘的影片。
2019年,三星的人工智慧實驗室創造了“Few-Shot”。它可以拍一張照片,把它想象成一個活生生的、有感情的、會說話的人。為了展示只需要一張照片的力量,他們使用了蒙娜麗莎。
人工智慧讓蒙娜麗莎栩栩如生
發明
發明是人類創造力的另一種表現。發明新的工具和技術改變了我們的生活方式。人類的創造力把我們從部落帶到了現代社會。
但是人類不再是唯一的聰明才智的擁有者。
計算機科學家約翰·科扎(John Koza)開創了遺傳程式設計領域。
遺傳程式設計的靈感來自於生物進化技術。它使程式能夠在尋找問題的最佳解決方案時進行自我更新和調整。
Koza利用這些技術建造了發明機器。
這臺發明機器最佳化並重新發現了天線、電路板、透鏡和工廠的設計。用柯扎的話來說,它能夠“自動合成六個光學鏡頭系統的完整設計,這些系統複製了以前獲得專利的鏡頭系統的功能。”
2005年,發明機器創造的一項設計被美國專利和商標局授予第6847851號專利。
人工智慧發明者的崛起給世界各地的專利局帶來了問題。
2018年,歐洲專利局(European Patent Office)以“機器沒有法人資格,不能擁有財產”為由,拒絕了兩項由人工智慧作為唯一發明者的發明。
現在有很多機器可以獨立完成很多工作而不是幫助工程師、科學家或發明家完成他們的工作。我們將會到達這樣一個階段,法院或立法機構會說人類是如此的不參與,如此多的層次被移除了,以至於實際的人類對發明的概念沒有貢獻。
Andrei Iancu,美國專利和商標局局長(2020年)
我們已經看到,人工智慧可以在象棋和圍棋等遊戲中發明新的戰略和戰術。
我們都希望機器能夠玩得非常穩定而緩慢,但AlphaZero卻恰恰相反。令人驚訝的是,看到一臺機器如此積極地行動,它也顯示出了強大的創造力。
加里·卡斯帕羅夫,國際象棋大師,前世界象棋冠軍
我以為AlphaGo是基於機率計算的,它只是一臺機器。但當我看到這個動作時,我改變了主意。AlphaGo當然是有創造力的。
李世石,9段職業棋手,前圍棋冠軍,指的是“第37步”
AI的推理能力
2004年,肯·詹寧斯(Ken Jennings)在智力競賽節目《危險邊緣》(Jeopardy!)中連續贏得74場比賽,創造了遊戲節目的歷史。
沒有人懷疑當今計算機的卓越記憶體。 它們在速度和準確性方面遠遠超過大腦。 但是儲存事實並知道如何應用它們是另一個問題。
這就是為什麼IBM將製造能夠在《危險邊緣》(Jeopardy)比賽中擊敗世界冠軍的人工智慧視為巨大挑戰的原因!一種遊戲,其線索通常需要解決複雜的語言謎題。
2009年,詹寧斯接到《危險邊緣》製片人的電話。他們問道:“IBM告訴我們,他們想建造一臺超級計算機,在‘危險邊緣’(Jeopardy)比賽中擊敗你。”’你準備好了嗎?”
詹寧斯的本職工作是計算機程式設計師。他知道計算機在這類問題上遠遠落後於人類。他想:“這簡直是兒戲。是的,我會來摧毀電腦,保護我的物種。”
人們沒有意識到編寫這樣一個程式是多麼困難,它可以讀懂像英語這樣的自然語言的《危險邊緣》的線索,並理解所有的雙關,雙關語,轉移話題,解開線索的意思。
肯詹寧斯
但在2011年的考驗中,詹寧斯和他的同胞布拉德·魯特(Brad Rutter)都無法擊敗沃森。這臺人工智慧以77147的比分結束了這場三局比賽,比它的人類對手的總比分還高。
詹寧斯接受了失敗,在他最後的回答下寫道:“我,作為一個人,歡迎我們新的計算機霸主。”
人類經常透過標準化的多項選擇測試來判斷其他人的推理能力。
艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)的研究人員公佈了一名名為阿里斯托(Aristo)的人工智慧測試者的測試結果。在短短三年的時間裡,阿里斯托從不及格的科學考試變成了滿分。
2016年,在紐約大學8年級的科學考試中,阿里斯托只能正確回答59.3%的問題,但到2019年,阿里斯托的答對率超過了90%。這個測試有這樣的問題:
哪種裝置能最好地分離鐵屑和黑胡椒的混合物?
(1)磁鐵(2)濾紙(3)三束天平(4)電壓表
當橡皮筋振動時,會產生哪種形式的能量?
(1)化學(2)光(3)電(4)聲
因為銅是一種金屬
(1)室溫下的液體(2)與其他物質不反應(3)電的不良導體(4)熱的良導體
在蘋果樹上,哪些過程主要是由細胞分裂引起的?
(1)生長(2)光合作用(3)氣體交換(4)廢物清除
據專案負責人彼得·克拉克(Peter Clark)說,“即使在五年前,計算機在理解文字內容方面也有很大的困難。多虧了快速的進步,我們現在有了能夠更好地理解語言的人工智慧系統。”
在下一節中,我們將看看人工智慧即將承擔的工作。