日前,據外媒報道,美國麻省理工學院(MIT)的研究人員展示了當某種特定的神經網絡被訓練執行導航任務時,其能夠理解該項任務真正的因果結構。該項研究能夠提升執行高風險的機器學習代理的可靠性和可信度,如在繁忙高速公路上駕駛自動駕駛汽車。
據悉,此類神經網絡能夠直接從視覺數據理解該任務,當在樹木密集或天氣條件變化迅速的地方等復雜環境中導航時,此類神經網絡比其他神經網絡更高效。該項新研究利用了此前Hasani和其他人的研究,后者展示了一種由液體神經網絡細胞構建的、受大腦啟發的深度學習系統-神經回路策略(Neural Circuit Policy,NCP),如何通過只有19個控制神經元的網絡自動控制一輛自動駕駛汽車。
研究人員觀察到,執行車道保持任務的NPC在做出駕駛決策時,會將注意力集中在道路的地平線和邊界上,這與人類駕駛汽車時的做法相同,而所研究的其他神經網絡并不會總會關注于道路。他們發現,當一個NCP在接受完成一個任務的訓練時,該神經網絡學會與環境互動,并理解干預行為。從本質上看,該網絡能夠識別其輸出是否被某種干預所改變,然后將因果聯系在一起。
在訓練過程中,該網絡向前運行以生成輸出,然后返回運行以糾正錯誤。研究人員觀察到,NPC會在前向運行和后向運行模式中將因果關系關聯起來,從而可以使該網絡能夠將注意力集中在真正的因果結構上。
研究人員發現,在天氣好的情況下,NPC在較簡單任務上的表現與其他神經網絡一樣好,但在更具挑戰性的任務上,如在暴雨中跟隨移動的物體時,NPC的表現要好于其他神經網絡。未來,研究人員希望探索采用NCP來構建更大的系統。將成千上萬的神經網絡連接在一起,從而讓其處理更復雜的任務。
(審核編輯: 智匯小新)
分享