百度Apollo學習筆記(3)——規劃技術

1.強化學習   強化學習(Reinforcement Learning, RL),又稱再勵學習、評價學習或加強學習,是機器學習的範式和方法論之一,用於描述和解決智能體(agent)在與環境的交互過程當中經過學習策略以達成回報最大化或實現特定目標的問題。web 2.約束條件 交通規則(必須遵照) 決策(如是否超車等) 最佳路徑 3.3D優化問題   迭代優化。最大指望算法(Expectation-
相關文章
相關標籤/搜索