【高質量能源內容,點選右上角加'關注'】
蓋世汽車訊 神經網路可以學習解決各種各樣的問題,如識別照片中的貓、駕駛自動駕駛汽車等。但是人們還是不知道此類強大的模式識別演算法是否真的理解其正在執行的任務。例如,一個神經網路的任務是讓自動駕駛汽車保持在自己的車道上,其可以透過觀察路邊的灌木叢來學習如何做到這一點,而不是學習探測車道以及專注於道路地平線。
神經網路學習導航任務的因果結構(圖片來源:MIT)
據外媒報道,美國麻省理工學院(MIT)的研究人員展示了當某種特定的神經網路被訓練執行導航任務時,其能夠理解該項任務真正的因果結構。因此此類神經網路能夠直接從視覺資料理解該任務,當在樹木密集或天氣條件變化迅速的地方等複雜環境中導航時,此類神經網路比其他神經網路更高效。
未來,該項研究能夠提升執行高風險的機器學習代理的可靠性和可信度,如在繁忙高速公路上駕駛自動駕駛汽車。
一種吸引人注意的結果
神經網路是一種進行機器學習的方法,計算機透過分析許多訓練例項以及反覆試驗來學習完成任務,而“液體”神經網路則改變其基礎方程,以不斷適應新的輸入資訊。
該項新研究利用了此前Hasani和其他人的研究,後者展示了一種由液體神經網路細胞構建的、受大腦啟發的深度學習系統-神經迴路策略(Neural Circuit Policy,NCP),如何透過只有19個控制神經元的網路自動控制一輛自動駕駛汽車。
研究人員觀察到,執行車道保持任務的NPC在做出駕駛決策時,會將注意力集中在道路的地平線和邊界上,這與人類駕駛汽車時的做法相同,而所研究的其他神經網路並不會總會關注於道路。
他們發現,當一個NCP在接受完成一個任務的訓練時,該神經網路學會與環境互動,並理解干預行為。從本質上看,該網路能夠識別其輸出是否被某種干預所改變,然後將因果聯絡在一起。
在訓練過程中,該網路向前執行以生成輸出,然後返回執行以糾正錯誤。研究人員觀察到,NPC會在前向執行和後向執行模式中將因果關係關聯起來,從而可以使該網路能夠將注意力集中在真正的因果結構上。
Hasani及其同事無需對系統施加其他額外限制,也不需要為NCP進行特殊設定以學習此種因果關係——會在訓練期間自動出現。
風化環境變化
研究人員透過一系列模擬測試NCP,在模擬場景中,無人機執行導航任務,每一架無人機採用單個攝像頭的輸入資訊進行導航。
該無人機的任務是飛行一個特定目標,追隨一個移動的目標,或者在不同環境中跟隨一系列標記,如晴朗的天空、大雨以及霧。
研究人員發現,在天氣好的情況下,NPC在較簡單任務上的表現與其他神經網路一樣好,但在更具挑戰性的任務上,如在暴雨中跟隨移動的物體時,NPC的表現要好於其他神經網路。
研究結果顯示,採用NCP能夠讓無人機在條件變幻莫測的環境中成功導航,例如陽光明媚的天氣突然變得霧濛濛時。
未來,研究人員希望探索採用NCP來構建更大的系統。將成千上萬的神經網路連線在一起,從而讓其處理更復雜的任務。
*凡本網註明來源為“中國能源報/中國能源網"”的所有文字、圖片和音影片資料,版權屬於中國能源報社所有,未經授權,不得轉載;凡本網註明來源非“中國能源報/中國能源網”的作品,版權歸原創者所有,並不代表本網立場和觀點,如有侵權,請聯絡刪除。