第二課:動態規劃

1.什麼是動態規劃? 之前提到解決序列決策問題有兩種手段----學習與規劃 當前有一個精確的環境模型時,可以用動態規劃去解 編程算法中也有動態規劃的概念,與其相似 總的來說,就是將問題分解成子問題,通過解決子問題,來解決原問題 動態:針對序列問題 規劃:優化,得到策略 貝爾曼方程是關鍵 2.動態規劃可以解決什麼問題? 動態規劃是一種解決問題的方法,什麼樣的問題能使用動態規劃去解? 這樣的問題具有以
相關文章
相關標籤/搜索