讓AI自動調參，纔是百度無人車的進化方式：適應環境全靠自己 | 論文

時間 2021-01-21

原文原文鏈接

車栗子發自凹非寺量子位出品 | 公衆號 QbitAI 自動駕駛汽車，需要應對各式各樣的路況，工作環境是每時每刻在變化的。所以，訓練好L4級的自動駕駛系統並不簡單。需要依賴獎勵函數 (Reward Function) 和代價函數 (Cost Function) 。如此一來，研究人員需要花大量精力，給強化學習裏的這些函數調參。環境越複雜，調參的工作就越難做。不過，百度自動駕駛

>>阅读原文<<