sponsored links

人工智慧已經進入“技術瓶頸”期,何時才能再次飛躍?

————人工智慧是否能真正地理解人類語言?

當前的人工智慧似乎很容易理解資料,但事實證明,設計對機器是否真正“理解”人類語言的測試很困難。2010年,一項人工智慧挑戰活動中來自IBM的Watson人工智慧獲得冠軍,隨後IBM宣稱:“Watson能夠理解人類自然語言的所有歧義和複雜性”。在這十年中,社會各界對人工智慧一片“唱響”,但是計算機科學家們透過長時間的研究發現我們高興的還是太早了!

雖然人工智慧在這十年中在各行業領域都發揮出了巨大的優勢,但是經過十年的發展,人工智慧可能要再次面臨瓶頸期。科學家在隨後尋求“用Watson人工智慧徹底改變醫學”的過程中就慘遭失敗,最近科研人員發現與Watson人工智慧在醫學上失敗一樣,人工智慧對人類語言的處理能力實際上處於“表層理解”與實際理解人類語言並不相同。

自然語言理解長期以來一直是人工智慧研究的主要目標。人工智慧發展初期,研究人員試圖手動程式設計機器需要理解人類的新聞故事、小說或人類可能表達的任何內容。但這種方法是徒勞的——不可能寫下理解文字所需的所有規則和假設,包括成文的和不成文的。

隨著機器神經網路的快速發展,人工智慧建立起語言識別的新模式——透過神經網路讓機器自己學習理解語言,只需為機器訓練大量文字並學習預測單詞即可,這就是目前的建立語言模型基本方法。

基於大型神經網路的人工智慧,比如OpenAI的GPT-3,這樣的模型甚至可以生成不可思議的人類散文和詩歌並且似乎能夠執行復雜的語言推理。

雖然GPT-3對來自數千個網站資料、書籍和百科全書的文字進行訓練,但是GPT-3是否就正在超越了Watson的“表面理解”模式?GPT-3真的理解它生成的語言所代表的推理嗎?目前這是AI研究界存在明顯分歧的話題。

此類討論曾經是哲學家的職權範圍,但在過去十年中,人工智慧已經從學術泡沫中迸發出來,進入了現實世界,它對現實世界缺乏的瞭解可能會產生真實的、甚至是毀滅性的後果。



科幻電影---機械公敵海報

在科研人員對IBM的Watson人工智慧應用於醫療實踐中,發現Watson多次對患者提出極不安全和不正確治療建議,谷歌的機器翻譯系統在為非英語患者翻譯醫療說明時也出現過重大錯誤(事實證明醫療藥品的英文說明不能指望機器翻譯,因為它可能會讓您“吃出毛病”)。

但是我們如何在實踐中確定機器是否可以理解?1950年,計算先驅艾倫圖靈試圖用他著名的“模仿遊戲”來回答這個問題,現在稱為圖靈測試。一臺機器和一個人都隱藏在幕後,僅使用對話的方式讓對面的測試者判斷哪個才是真人。如果測試者無法分辨哪個是人類,那麼,我們應該認為機器正在以人類的方式思考——實際上就是理解人類的語言。

不幸的是,不是圖靈高了機器,而是高估了人類。例如,1960年代的機器心理治療師Eliza是一個很簡單的聊天機器人,它也會欺騙人們,讓人們相信他們正在與正常人類交談,難以理解的是即使人們知道他們對話的夥伴是一臺機器,仍然有很多人相信對面是一個人!

2012年的一篇論文中,計算機科學家提出了一個更客觀的測試,稱之為“威諾格拉德模式挑戰(Winograd)”的模式挑戰。此測試已被AI語言領域廣泛採用,作為評估機器理解能力的一種有效方式,也許是最好的方式——儘管它並不完美。模式由一對句子組成,這些句子僅相差一個詞,每個句子後跟一個問題。

【威諾格拉德模式挑戰:英語:Winograd Schema Challenge,縮寫WSC,是多倫多大學計算機科學家提出的機器智慧測試,該測試是對傳統圖靈測試的改進,在機器不能使用谷歌搜尋(或類似搜尋引擎)來正確回答問題的前提下,透過向機器詢問特別設計的選擇題來檢測其人機互動的智慧水平】

這裡有兩個例子:

例一

第1句:我把瓶子裡的水倒進杯子裡,直到它滿了。
問題:什麼是滿的,瓶子還是杯子?
第2句:我把瓶子裡的水倒進杯子裡,直到杯子空了。
問題:什麼是空的,瓶子還是杯子?

例二

第1句:喬的叔叔在網球上仍然可以擊敗他,儘管他已經 30 歲了。
問題:誰大,喬還是喬的叔叔?
第2句:喬的叔叔在網球上仍然可以擊敗他,即使他比他年輕 30 歲。
問題:誰更年輕,喬還是喬的叔叔?

基於神經網路的語言模型在測試上達到了大約 97% 的準確率,這大致相當於人類的表現。

在每個句子對話中,一個詞的差異可以改變代詞所指的事物或人。正確回答這些問題似乎需要常識性的理解。“威諾格拉德模式挑戰(Winograd)”正是為了測試這種理解而設計的,目的是儘量減少人工智慧對人類語言的誤解和理解上的脆弱性。

隨著大型神經網路語言模型的出現,人工智慧程式解決 Winograd 模式的能力迅速提高。2020年,OpenAI的GPT-3透過Winograd測試的準確率達到90%,在專門針對這些任務進行訓練後,其他語言模型的表現甚至更好。最近的人工智慧語言理解競賽SuperGLUE,某神經網路語言模型達到了約 97% 的準確率,這種準確性接近人類的水平。

這是否意味著神經網路語言模型已經達到了人類的理解水平?

不必然,儘管競賽建立者盡了最大的努力使競賽的問題無法透過谷歌或其他引擎搜尋,但是這些挑戰,就像許多其他當前的人工智慧語言理解測試一樣,對於神經網路在不理解的情況下也能表現良好成績是允許的(高分低能)。

例如,句子“跑車超過郵車因為它開得更快”和“跑車超過郵車因為它開得更慢”。透過龐大英語詞、句語料庫上訓練的語言模型將吸收“跑車”和“快”之間以及“郵車”和“慢”之間的數學相關性。因此,僅僅根據大量資料訓練出來的關聯性不用借鑑任何理解也能正確的回答類似問題。目前各類類似SuperGLUE的比賽中無法排除利用統計相關性作答正確的情況。

當前神經網路語言模型已經變得越來越大,而且它們越大在這種挑戰中的得分就越高。目前最好的神經網路語言模型——已經在TB級文字上進行訓練,然後在數千個WinoGrande(Winograd等增強版本)示例上再進一步訓練——已經能夠接近90% 的正確率(人類獲得大約 94% 的正確率)。這種效能的提高几乎完全是由於神經網路語言模型及其訓練資料大小增加的。

理解語言需要理解世界,而只接觸語言的機器無法獲得這樣的理解。

這些越來越大的神經網路語言模型最終是否達到了人類的常識性理解?部分科研人員認為這不太可能。WinoGrande競賽的結果帶有一些重要的警示意義。例如,由於挑戰賽的句子依賴於人工編寫,因此編寫的質量和連貫性參差不齊。此外,用於剔除“谷歌搜尋”句子的方法可能過於簡單,人工又無法發現大型神經網路所有的統計捷徑。

當前的問題關鍵在於理解語言需要理解世界,而只接觸語言的機器是無法獲得這樣的理解。人類理解“跑車超過郵車因為它開得更慢”的含義相比機器要廣泛和深層的多。“跑車超過郵車因為它開得更慢”的人類理解含義是:開跑車的人嫌郵車開得慢,人的理解是建立在人驅動車的基礎上,而不是跑車與快、郵車與慢的關聯性統計。語言真正代表的是人類思想的表達,而不是當前人工智慧資料關聯性的統計。

人工智慧的機器可以在閱讀測試中擊敗人類,但他們真的明白嗎?

透過最新生物神經學的研究成果,人腦神經網路的複雜程度和工作模式遠遠不是現在的人工智慧比擬的,人類大腦僅僅百萬分之的神經元對映資料就需要1.4 PB(計算機儲存單位1.4 PB=1024TB)計算機儲存空間。人類大腦擁有860 億個神經元,每一個神經元都與其他神經元之間會有數十個至上千的連線,甚至於神經元的連線也有可能拓展至量子領域,計算這種網路結構的複雜性已經不亞於天文學和量子力學的計算量,這也是人類大腦可以用無數種方式做事的根本原因。(關於人類大腦神經網路的最新科研進展,有興趣的讀者可以查閱作者之前釋出的文章“科學家即將揭示人類大腦神經網路結構的奧秘”)



人類神經網路結構



人類神經網路對映

為什麼像AlphaZero這樣的人工智慧在現實世界中遇到諸多麻煩?所有這些機器遇到的問題都是我們人類認為理所當然的常識,但這些常識現在還無法內建到機器中,也沒有可能性寫在任何語言模型的訓練文字中。人類依賴於空間、時間和許多其他先天的、語言之前就具備基本屬性來學習和理解語言。

神經網路使用的是統計捷徑——而不是實際展示對人類語言的理解能力!語言代表的是思想,而解析人類複雜的大腦和看似無限的神經元連線結構是一項極其宏偉的挑戰,考驗著人類和人工智慧的極限。

當前社會的“量子熱”、“人工智慧熱”需要以發展的角度“降降溫”、“去去火”,要知道任何科學技術的突破是都是逐步積累的過程,沒有積累便不會有飛躍。在人類生物神經學和量子計算兩大領域方向沒有取得重大實質性突破前,當前的人工智慧很難產生第三次飛躍,人工智慧領域也將迎來第二次技術沉澱期,當然技術沉澱不代表不進步,目前人工智慧的應用領域還是十分廣闊的,現有的研究成果也足夠促進人類文明前進一大步。

分類: 體育
時間: 2021-12-15

相關文章

1998年,17歲的體操運動員桑蘭,比賽時摔成癱瘓,如今她怎樣了?

1998年,17歲的體操運動員桑蘭,比賽時摔成癱瘓,如今她怎樣了?
2020東京奧運會賽程已經過半,我國運動員透過努力拼搏取得了可喜可賀的成績,在這些榮譽獎牌的背後,是運動員們多年來的堅持與不易. 運動員一旦站上賽場代表的是整個國家,身上的使命感不允許他們有片刻的放鬆 ...

鄧弗里斯:我比賽時要不斷向前並拉開寬度 很自豪能加盟國米

鄧弗里斯:我比賽時要不斷向前並拉開寬度 很自豪能加盟國米
直播吧9月19日訊 國米6-1大勝博洛尼亞,本場表現出色的鄧弗里斯賽後表示,他比賽中要不斷向前並拉開場地寬度. 鄧弗里斯說道:"在輸給皇馬後,我們需要做出回應,這是一場很好的比賽,我很高興. ...

全運會羽毛球比賽收官,湖北隊收穫一金一銀三銅

全運會羽毛球比賽收官,湖北隊收穫一金一銀三銅
9月17日,第十四屆全運會羽毛球專案進入最後一天的爭奪,湖北隊女雙選手杜玥/李茵暉進入最後的決賽,挑戰東京奧運會銀牌組合賈一凡/陳清晨.最終,在這場國家隊一號和二號女雙的"內戰"中 ...

馬競球迷組織致信足協:別再安排本輪主裁吹罰馬競比賽

馬競球迷組織致信足協:別再安排本輪主裁吹罰馬競比賽
直播吧9月20日訊 馬競在本輪聯賽被畢爾巴鄂競技逼平,菲利克斯被主裁熱蘇斯-曼薩諾連續出示2黃罰下,這一判罰引發了馬競球迷的強烈不滿. 馬競球迷組織也向西班牙足協致信,強烈譴責了這位主裁的判罰,並指出 ...

寶媽質疑比賽黑幕後續:遭網友打臉,唯結果論的父母真可怕

寶媽質疑比賽黑幕後續:遭網友打臉,唯結果論的父母真可怕
文|小魚奶爸日記原創,歡迎個人轉發和分享 隨著家長對孩子特長髮展的重視,各種型別的比賽也層出不窮,初心是好的,可不知從什麼時候開始變了味,很多家長甚至將參加比賽的獎狀當做孩子學習特長的目的和最終意義. ...

巴頓:默裡不在時要靠團隊贏球,小波特要繼續做自己
虎撲09月24日訊 今天,掘金球員威爾-巴頓接受了採訪. 談到賈馬爾-默裡會缺席比賽時球隊的應對,巴頓說:"沒有人能代替賈馬爾-默裡,但其他人會得到機會,我們要努力透過一支團隊的作用來贏球. ...

時髦的老徐
老徐,是我們單位的技術專家,江蘇人,個頭很高,為人隨和,一口地道的江蘇方言,也是我們的專業組組長,我來單位後,也是他從人事部門把我要到這個組裡的. 老徐在技術上,能力沒的說,引領專業方向,他超前而有遠 ...

如何制定適合自己的運動方案(三)-跟腱斷裂的風險

如何制定適合自己的運動方案(三)-跟腱斷裂的風險
#健康明星計劃# 不管進行什麼型別的運動,受傷的風險總是如影隨形.就是身體素質過硬,有專業訓練的運動員,也可能在比賽中發生意外.人體在運動中最容易受到傷害的兩個位置:跟腱和前交叉韌帶.今天先講講跟腱. ...

中國第一位奧運蟬聯冠軍,多套動作以他名字命名,被譽為跳馬之王

中國第一位奧運蟬聯冠軍,多套動作以他名字命名,被譽為跳馬之王
那一年,他二十歲,大圓腦袋,短壯身材,粗粗的大腿,一個極其普通的中國人,或者說是一個不被裁判看得上眼的體操運動員.可他在第二十三屆奧運會體操賽上,以出色的表演,奪得了男子跳馬冠軍,這是中國人的驕傲.他 ...

科普 | 誰是有史以來排名前五的F1車手?

科普 | 誰是有史以來排名前五的F1車手?
世界一級方程式錦標賽(FIA Formula 1 World Championship,簡稱F1),是國際汽車運動聯合會(FIA)舉辦的最高等級的年度系列場地賽車比賽,是當今世界最高水平的賽車比賽,與 ...

《哈利波特》:復活石到底是聖器還是魂器,它真的能讓人復活嗎?

《哈利波特》:復活石到底是聖器還是魂器,它真的能讓人復活嗎?
常常有朋友在評論區裡同我爭執不休,他們老覺得"魔法石"和"復活石"是同一塊. 也有人分不清楚"復活石"到底是"聖器"還是 ...

豪車為什麼總超速?

豪車為什麼總超速?
無論是開過豪車還是坐過豪車的人,基本都會達成這樣一個共識,那就是豪車總會在不知不覺中就超速行駛了,而此時車內無論是司機還是乘客卻不會察覺到任何異樣.這其中的原因,除了豪車的動力更強勁外,其實更多是因為 ...

孫儷的心酸成名史,她一步步的改變了自己的結局

孫儷的心酸成名史,她一步步的改變了自己的結局
孫儷或許是許多人的時代記憶,現在的她擁有著一線資源. 製片方拿著劇本請她來挑,其在娛樂圈兒裡的位置不言而喻. 對於孫儷來說,她背後所經歷的,恐怕是我們常人難以想象的. 曾幾何時,孫儷也只不過是一個普通 ...

陳露:冰上蝴蝶 夢無止境

陳露:冰上蝴蝶 夢無止境
編者按:他們都曾經是中國花樣滑冰的標誌性人物或一代名將,在世界大賽中為中國花滑爭得巨大的榮譽.如今,他們已離開賽場多年,但從未離開過摯愛的冰面.他們把原來的賽場變成了未來的舞臺,全力以赴為北京冬奧會和 ...

蘇富比將拍兩款古印度眼鏡,估計2255萬,鏡片為白鑽和祖母綠

蘇富比將拍兩款古印度眼鏡,估計2255萬,鏡片為白鑽和祖母綠
美國電視新聞網訊息,蘇富比下個月的拍賣會上,會有兩副來自17世紀古印度,鑲有珠寶的眼鏡,鏡片由鑽石和祖母綠製成,預計將拍得350萬美元,約合2255萬人民幣.據悉,這眼鏡最初屬於曾統治印度次大陸的莫臥 ...

運動堅持不了?不是你懶,是它不夠給力……

運動堅持不了?不是你懶,是它不夠給力……
每天都想運動,卻只停留在想想的階段? 看一圈運動裝備,是不是發現別有天地? 裝備在手,說走就走! 別再給自己找藉口了! 說不清是為運動而置辦的裝備,還是因為有了高顏值還實用的裝備而去運動.要運動也要時 ...

馬琳:18個世界冠軍,結婚現場宣佈退役,婚後稱妻子是白月光

馬琳:18個世界冠軍,結婚現場宣佈退役,婚後稱妻子是白月光
世界冠軍的領獎臺他登過18次,數量之多令人瞠目結舌. 世界盃的男單冠軍他蟬聯了四屆,厲害如此,他是第一人. 他在國乒歷史上排第三位,他就是馬琳. 刻苦訓練,一週練壞一雙鞋 一雙鞋子穿多久才會壞?普通人 ...

一個資深體育記者發3000字長文 羽毛球若不改變 將被愛它的人拋棄

一個資深體育記者發3000字長文 羽毛球若不改變 將被愛它的人拋棄
從某種程度上講,羽毛球是一項相當"變態"的運動."4P"(雙打)的時候很嗨,但"2P"(單打)常令人痛不欲生."6P"( ...

江蘇學霸女神:50門課程滿績,穩居全校第一,如今保送985名校深造!

江蘇學霸女神:50門課程滿績,穩居全校第一,如今保送985名校深造!
少年有志,頭角崢嶸.她始終秉持著求知求真的信念,以廣博紮實的基礎向下紮根,以開闊明朗的勇氣向上開花,銳意進取,內外兼修,不懈追求,點亮青春之光,最終以推免考核雙第一的成績,保研至同濟大學,為大學四年交 ...

1950年,特等功臣被抬進病房,發現竟是女兒身,軍長:全軍驕傲

1950年,特等功臣被抬進病房,發現竟是女兒身,軍長:全軍驕傲
花木蘭劇照 "唧唧復唧唧,木蘭當戶織.不聞機杼聲,唯聞女嘆息."<木蘭辭>講述了南北朝時期家喻戶曉,花木蘭替父從軍的故事. 千年之後,在共和國群英譜中,有一個不凡的名字 ...