sponsored links

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

人工智慧(AI)的很多潛在應用,涉及與人類互動時做出更最佳化的實時決策,而競技或者博弈類遊戲,便是最佳的展示舞臺。

今天,發表在《自然》雜誌上的封面文章報告稱,AI 在賽車對戰遊戲 Gran Turismo(GT賽車)中戰勝了世界冠軍級人類玩家。這個 AI 程式名為“Gran Turismo(GT)Sophy”,是一種神經網路驅動程式,它在遵守賽車規則的同時,展現出了超凡的行駛速度、操控能力和駕駛策略。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

(來源:Nature)

完成這項 AI 程式研發的核心團隊來自索尼 AI 事業部(Sony AI),《GT賽車》系列遊戲是日本 Polyphony Digital 公司開發,忠實再現了真實賽車的非線性控制挑戰,封裝了複雜的多智慧體互動,該遊戲在索尼 PlayStation 及 PSP 等遊戲主機平臺上皆有發行,是一款極具擬真感操縱體驗的熱門賽車遊戲。

假如有此 AI 程式的加持,人類玩家估計再也跑不過加強版的單機程式了吧?

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

圖|遊戲截圖(來源:GT賽車)

研究人員認為,此項成果或讓賽車遊戲變得更有意思,並能提供用來訓練職業賽車手和發現新賽車技巧的高水平比賽。這種方法還有望應用在真實世界的系統中,比如機器人、無人機和自動駕駛汽車等。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

賽道里的速度與激情

駕駛賽車需要極大的技巧。現代一級方程式賽車展示了驚人的工程精度,然而,這項運動的受歡迎程度與其說與汽車的效能PK有關,不如說與頂級車手在將汽車效能發揮到極限時所表現出的技巧和勇氣有關。一個多世紀以來,賽道上的成功一直充滿著速度和激情。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

圖|F1方程式賽車比賽(來源:GNEWS)

賽車比賽的目標很簡單:如果你比競爭對手在更短的時間內跑完賽道,你就贏了。然而,實現這一目標需要極其複雜的物理戰,馳騁賽道需要小心使用輪胎和道路之間的摩擦力,而這種摩擦力是有限的。

為了贏得比賽,車手必須選擇讓汽車保持在不斷變化的摩擦極限內的軌跡上。轉彎時剎車太早,你的車就會慢下來,浪費時間。剎車太晚,當你接近轉彎最緊的部分時,你將沒有足夠的轉彎力來保持你想要的路線軌跡。剎車太猛,可能會導致車體旋轉。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

因此,職業賽車手非常擅長在整個比賽中一圈接一圈地發現並保持賽車的極限。

儘管賽車的操縱極限很複雜,但它們在物理上可以得到很好的描述,因此,它們可以被計算或學習是理所當然的。

近年來,深度強化學習(DRL)已成為 Atari、星際爭霸和 Dota 等領域 AI 研究里程碑的關鍵組成部分。為了讓 AI 對機器人技術和自動化產生影響,研究人員必須證明能夠成功控制複雜的物理系統,此外,AI 技術的許多潛在應用要求在接近人類的情況下相互作用,同時尊重不精確的人類規範,汽車比賽正是充滿這些挑戰的典型領域。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

圖|遊戲比賽資料對比(來源:Nature)

近年來,利用全尺寸、大規模和模擬車輛,自主賽車的研究不斷加速。一種常見的方法是預先計算軌跡,並使用模型預測控制來執行這些軌跡。然而,當在摩擦的絕對極限下行駛時,微小的建模誤差可能是災難性的。

與其他車手比賽對 AI 建模精度提出了更高的要求,並引入了複雜的空氣動力學相互作用,進一步促使工程師改進控制方案,以不斷預測和適應賽道的最優軌跡,有朝一日,無人駕駛汽車下賽道與人類車手一決高下,也並非空談。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

“AI賽車手”的煉成

在 GT Sophy 的開發過程中,研究人員探索了各種使用機器學習來避免建模複雜性的方法,包括使用監督學習來建模車輛動力學,以及使用模仿學習、進化方法或強化學習來學習駕駛策略。

為了取得成功,賽車手必須在四個方面具備高度技能:(1)賽車控制,(2)賽車戰術,(3)賽車禮儀和(4)賽車策略。

為了控制汽車,車手們對他們的車輛動力學和賽道的特性有詳細的瞭解。在此基礎上,駕駛者建立所需的戰術技能,透過防守對手,執行精確的演習。同時,駕駛員必須遵守高度精煉但不精確的體育道德規則,最後,車手在模擬對手、決定何時以及如何嘗試超車時,會運用戰略思維。

模擬賽車是一個需要在具有高度真實、複雜物理環境中進行實時、連續控制的領域,GT Sophy 在這種環境下的成功首次表明,在一系列汽車和賽道型別中,有可能訓練出比頂尖人類賽車手更好的人工智慧代理。

這一結果可以被視為是計算機在國際象棋、圍棋、冒險、撲克牌和星際爭霸等競爭性任務持續發展的另一個重要步驟。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

圖|GT Sophy 的訓練(來源:Nature)

值得注意的是,GT Sophy 在短短几個小時內就學會了繞道而行,並超過了資料集中 95% 的人類選手,它又訓練了九天時間,累計駕駛時間超過了 45000 小時,跑圈時間減少了十分之一秒,直到圈速停止改善。

單憑進步獎勵還不足以激勵AI程式贏得比賽。如果人類對手的速度足夠快,AI程式將學會跟隨,並在不冒潛在災難性碰撞風險的情況下嘗試積累更多獎勵,實現超車。

為了評估 GT Sophy,研究人員在兩項賽事中讓 GT Sophy 與頂級 GT 車手進行了較量,GT Sophy 在所測試的三條賽道上都取得了超人的計時錶現,它能夠執行幾種型別的轉彎,有效地利用漂移,擾亂後面車輛,攔截對手並執行其他緊急操縱。

儘管 GT Sophy 展示了足夠的戰術技能,但仍有許多方面有待改進,尤其是在戰略決策方面。例如,GT Sophy 有時會在同一條跑道上留出足夠的空間,讓對手有機可乘。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

圖|AI 車手超越人類玩家(來源:Nature)

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

競技遊戲外更值得關注

關於電子競技、博弈類的遊戲,AI 能戰勝人類早已經不是什麼稀奇事,而且可以肯定的是,AI 還會越來越強,即便是人類頂尖選手也只能甘拜下風,但能贏電子比賽並沒有太多懸念和意義,關鍵還是看這些超越人類的 AI 程式如何切實攻克產業瓶頸,真實造福人類生活。

1996 年 2 月 10 日,超級電腦 Deep Blue 首次挑戰國際象棋世界冠軍 Kasparov 以 2:4 落敗。1997 年 5 月再度挑戰,最終Deep Blue 以 3.5:2.5 擊敗了 Kasparov ,成為首個在標準比賽時限內擊敗國際象棋世界冠軍的電腦系統。

但 Deep Blue 的缺陷是沒有直覺,不具備真正的“智慧靈魂”,只能靠超強的計算能力彌補分析思考方面的缺陷,贏得比賽的 Deep Blue 很快也退役了。

Nature封面:人類又輸給了AI,這次是玩《GT賽車》遊戲

2016 年 3 月,谷歌 AI 的 AlphaGo 在四場比賽中擊敗了圍棋世界冠軍李世石,被認為是 AI 真正意義上的里程碑,AlphaGo 當時使用了蒙特卡洛樹搜尋與兩個深度神經網路相結合的方法,在這種設計下,電腦可像人類大腦一樣自發學習進行分析訓練,不斷學習提高棋力。

自此之後,各類 AI 程式新秀層出不窮,2018 年 12 月 10 日,DeepMind 針對即時戰略遊戲星際爭霸開發的人工智慧 AlphaStar 能完虐全球 99.8% 的人類職業選手。

無疑,現在的 GT Sophy 又是一個 AI 勝利的延續。

來自斯坦福大學機械工程系教授 J.Christian Gerdes 認為,GT Sophy 研究所帶來的影響也許能遠遠超出電子遊戲範疇,隨著許多公司致力於完善運送貨物或乘客的全自動車輛,關於軟體中有多少應該使用神經網路,以及有多少應該僅基於物理,值得進一步去探索。

總的來說,在感知和識別周圍環境中的物體時,神經網路是無可爭議的冠軍。然而,軌跡規劃仍然是物理和最佳化領域,GT Sophy 在遊戲賽道上的成功表明,神經網路有一天可能會在自動化車輛的軟體中發揮比今天更大的作用。

更具挑戰性的可能是每圈的變化。真實情況下,賽車的輪胎狀況在每圈之間都會發生變化,人類駕駛員必須在整個比賽過程中適應這種變化。GT Sophy 能用更多的資料做同樣的事情嗎?這些資料從何而來?這將使得人工智慧有更多進化空間。

參考資料:

https://www.nature.com/articles/s41586-021-04357-7
https://www.nature.com/articles/d41586-022-00304-2

來源:學術頭條

分類: 健康
時間: 2022-02-11

相關文章

聞名全國的“8碗粉”,幾天不吃就嘴饞,你最喜歡哪一種呢?

聞名全國的“8碗粉”,幾天不吃就嘴饞,你最喜歡哪一種呢?
北方人喜歡吃麵,有很多聞名全國的麵食,深受大家的喜歡,比如炸醬麵.牛肉麵.臊子面.陽春麵等等,而在南方,大家則喜歡吃粉,各種味道應有盡有,由於口感,味道比較受人歡迎,所以無論在北方,南方,大家對於粉的 ...

中秋夜小零食,簡單易做,滿口香,嘴饞沒商量

中秋夜小零食,簡單易做,滿口香,嘴饞沒商量
你們手機裡藏著什麼秘密?哈哈,我當然不是來查手機,而是要給大家分享我手機裡的秘密. 別急別急,這些秘密你得聽我慢慢道來.沒錯,作為一個不折不扣的頂級小吃貨,我手機裡的秘密就是數不清的美食圖片和商家. ...

嘴饞狒狒光明正大偷鵝蛋,遭看蛋的埃及鵝暴打,狒狒會如願以償嗎

嘴饞狒狒光明正大偷鵝蛋,遭看蛋的埃及鵝暴打,狒狒會如願以償嗎
這幾隻狒狒已經好長時間沒有吃過一頓飽飯了,它們是群居性動物,有明顯的等級制度和嚴明的紀律.飢腸轆轆的它們打起了一群鵝寶寶的主意.狒狒主要生活在熱帶雨林,半荒漠草原,低山丘陵等地方,白天在地面上活動,也 ...

不想吃出“畸形胎”,這些食物要避開,孕媽們彆嘴饞

不想吃出“畸形胎”,這些食物要避開,孕媽們彆嘴饞
女性懷孕後最擔心的就是胎兒的發育是否健康,其實,與其焦慮這些,不妨自己多做些預防.尤其是在吃的方面,有據可考,畸形胎的形成近百分之四十和吃有關,佔了形成原因的絕大多數.那麼孕期包括備孕期,哪些食物需要 ...

豬肉這吃法太舒坦了,餓了饞了來一片,越嚼越香,做法還不難

豬肉這吃法太舒坦了,餓了饞了來一片,越嚼越香,做法還不難
豬肉脯是一種特別解饞的小零食,鹹中微甜,芳香濃郁.一般有兩種做法,一種是豬肉直接切薄片醃製後烘乾做成,還有一種是把豬肉剁碎以後醃製,重新加工成"肉片"烘乾,這兩種做法都非常好吃,但 ...

吃好早餐、自帶蔬果……幫孩子們把糖減下去

吃好早餐、自帶蔬果……幫孩子們把糖減下去
來源:生命時報 本報記者 張筱悅 對於孩子們來說,甜食似乎有種無法抵擋的魅力,尤其在炎熱的夏天,經常能看到穿著校服的中小學生頻繁出入超市,購買冷飲雪糕以及各種含糖零食.即便在日常飲食中,孩子們也總是 ...

北京教委出手了!323名小胖子吃“瘦”了,秘訣在這裡

北京教委出手了!323名小胖子吃“瘦”了,秘訣在這裡
一個多月前,來自北京76所學校三.四年級的323名"小壯壯"開啟了一場"減肥大作戰"--由市教委組織開展的"三精準"方法健康控制體重實踐活動 ...

遇見以下5種動物撒腿就跑,否則有致命危險

遇見以下5種動物撒腿就跑,否則有致命危險
在自然界中,美麗的生物往往更容易引人注意,從而暴露在危險之中,或許正是因為這個原因,外表越是美麗動人的生物,身懷劇毒的可能性也就越大. 今天就讓我們來看看幾種看上去非常美麗,實際上卻身懷劇毒的動物吧, ...

明明已經飽了,為什麼還是忍不住想吃東西?

明明已經飽了,為什麼還是忍不住想吃東西?
很多人都有過這種體驗:有時候明明已經飽了,還有胃口再吃點兒:剛吃完正餐不久,仍然惦記著零食或甜點. 其實,這種"飽了還想繼續吃"的現象不一定是嘴饞,而是一種心理欺騙:大腦滿足了,但 ...

秋天進補,這肉多給孩子吃,順應季節,滋補不上火,簡單一燜真香

秋天進補,這肉多給孩子吃,順應季節,滋補不上火,簡單一燜真香
秋天進補,這肉多做給孩子吃,順應季節,滋補不上火,簡單一燜真香.入秋啦,受到秋老虎天氣的影響,初秋時節氣候依然很炎熱,這個時候我們的日常還是要多喝水,注意防暑降溫.除此之外,秋天進補貼秋膘也該開始提上 ...

蔡暢與李富春相伴53年,遺憾未見丈夫最後一面,為事業做絕育手術

蔡暢與李富春相伴53年,遺憾未見丈夫最後一面,為事業做絕育手術
"記取鐵肩擔道義,雙飛李蔡兩名家-柳亞子" 1900年5月,前後只相差8天的時間裡,蔡暢和李富春呱呱降生於湖南.兩人不光是老鄉,更於1919年前後腳來到法國勤工儉學,緣分,真是妙不 ...

鹹食、甜食、葷食不健康就不能吃了?當然不是

鹹食、甜食、葷食不健康就不能吃了?當然不是
導語:現在每10個人中,就有可能有一個人患有慢性的腎臟疾病,而且發病率是非常高的,當然原因也是多方面的. 首先是現代人大部分屬於處於亞健康,身體素質本來就不好,導致慢性疾病的患病風險,提高了. 再就是 ...

青島近海大公島海軍觀通站軼事回憶之三
俗話講,靠山吃山,靠水吃水.雖然我們觀通站四周全是大海,況且,海島周圍海域裡有極為豐富的魚類資源,有鮁魚,鱸魚,黑魚和馬面魚等.海珍品有海參,鮑魚和貝類等.是青島近海漁場.但是由於島的南邊是浩淼無際的 ...

給別人養了七年的兒子
臨睡前,曾紅兵給兒子樂樂剪指甲. 剪了一會兒,他發現兒子的食指頭上是個籮,便心血來潮,抓起其他手指細細察看,興沖沖地數起籮來:一籮窮,二籮富,三籮四籮開當鋪-- 曾紅兵說的是老家方言,樂樂沒聽懂,只覺 ...

“與青春有關的日子”系列之七:家教

“與青春有關的日子”系列之七:家教
家教可能是我們上大學那會勤工儉學最主要的方式了. 大概是大二下學期吧,功課不緊張,也沒談戀愛,沒有了新生的新鮮勁兒,還沒有老生的老成樣兒,不甘寂寞的我就到學生部報了名,想鍛鍊一下自己,接觸一下社會. ...

吃早餐時不僅要少喝大米粥,醫生:下面3種食物也儘量少吃

吃早餐時不僅要少喝大米粥,醫生:下面3種食物也儘量少吃
導語:一說到早餐不得不說到早起這件事,現在的工作,早上上班時間大約都在上午8點半到9點開始,這讓很多年輕人養成睡懶覺的習慣,因此吃早餐的時間大大縮短. 而且生活中很多人養成不吃早餐或者隨意應付的習慣. ...

減肥期間也能吃的3款甜品,每款熱量都在100卡左右,怎麼吃也不胖

減肥期間也能吃的3款甜品,每款熱量都在100卡左右,怎麼吃也不胖
對於減肥的人來講,甜食是減肥中最大的敵人了,簡直是比脂肪還可怕的存在,尤其是對於女孩子來講.絕大部分女性對甜食的愛絕對是與生俱來的,身為"甜食黨"的你,狠心拒絕甜食誘惑後是不是更易 ...

4種熱量很高的主食,米飯饅頭不算啥,常吃第四種當心變“胖子”

4種熱量很高的主食,米飯饅頭不算啥,常吃第四種當心變“胖子”
隨著人們生活水平的提高,吃的東西也越來越豐富,然而相反的是,人們的勞動強度卻越來越低,因此肥胖的人群數量也是逐年升高.稍微懂一點常識的人都會明白,身體過度肥胖,不單單是影響美觀,而更重要的是會給我們的 ...

《紅樓夢》播出34年:“林黛玉”出家,薛寶釵至今未嫁

《紅樓夢》播出34年:“林黛玉”出家,薛寶釵至今未嫁
蔣勳說,<紅樓夢>這部書,不過就在做一件事--曹雪芹把自己一生記憶裡有情緣的人,做最後一次掩埋. <紅樓夢>誕生至今,已經有300多年曆史.20世紀以來,關於<紅樓夢&g ...

炸肉丸子別加錯了粉,教你正確做法,酥脆鮮嫩又多汁,還不油膩

炸肉丸子別加錯了粉,教你正確做法,酥脆鮮嫩又多汁,還不油膩
各位讀者朋友們大家好,感謝閱讀我分享的美食文章,經驗和大家一起共享,今天我要和大家分享的內容是:『炸肉丸子別加錯了粉,教你正確做法,酥脆鮮嫩又多汁,還不油膩!』 中秋節快到了,準備做什麼大餐呢?朋友跟 ...