指導Agent在XX的環境中做出最優決策的模型框架

時間 2021-01-01

原文原文鏈接

任務：自動駕駛具備人的行爲智能（指導Agent在XX的環境中做出最優決策的模型框架）的目的。針對自動駕駛問題，提出不需要專家知識輔助的簡單說明：增強學習中神經網絡需要完成的任務：針對圖像，通過（神經網絡）抽象出任務所處環境的特徵信息，將特徵信息與動作行爲之間建立聯繫（相比於傳統圖像識別任務：特徵信息與識別目標位置、類別之間建立聯繫）。Agent需要與環境層（真實環境，模擬環境，遊戲環境）相互試

>>阅读原文<<