RL加強學習在無人駕駛中的應用

csdn公式編輯器很差用,就直接從word裏面截圖發上來一些理論公式:程序員 長期規劃問題算法 迷宮:複雜決策的情景----咱們只有把基於搜索的和基於加強學習的算法結合,纔能有效解決這類問題。安全 圍棋:肯定性的環境,長期獎勵----基於搜索的和基於加強學習的算法結合網絡 自動駕駛:環境非肯定--轉移函數未知架構 自動駕駛簡介框架 感知、決策和控制編輯器 決策:(對安全和可靠性有着嚴格要求)分佈式
相關文章
相關標籤/搜索