指導Agent在XX的環境中做出最優決策的模型框架

任務:自動駕駛具備人的行爲智能(指導Agent在XX的環境中做出最優決策的模型框架)的目的。 針對自動駕駛問題,提出不需要專家知識輔助的 簡單說明:增強學習中神經網絡需要完成的任務:針對圖像,通過(神經網絡)抽象出任務所處環境的特徵信息,將特徵信息與動作行爲之間建立聯繫(相比於傳統圖像識別任務:特徵信息與識別目標位置、類別之間建立聯繫)。Agent需要與環境層(真實環境,模擬環境,遊戲環境)相互試
相關文章
相關標籤/搜索