讓AI自動調參,纔是百度無人車的進化方式:適應環境全靠自己 | 論文

車栗子 發自 凹非寺 量子位 出品 | 公衆號 QbitAI  自動駕駛汽車,需要應對各式各樣的路況,工作環境是每時每刻在變化的。 所以,訓練好L4級的自動駕駛系統並不簡單。需要依賴獎勵函數 (Reward Function) 和代價函數 (Cost Function) 。 如此一來,研究人員需要花大量精力,給強化學習裏的這些函數調參。環境越複雜,調參的工作就越難做。  不過,百度自動駕駛
相關文章
相關標籤/搜索