【二十】策略搜索

部分可觀測馬爾科夫決策過程 Partially Observable MDPs POMDPs 在上一講中咱們介紹了Kalman Filter方法,這一方法討論了咱們只能經過觀測而不能經過直接得到的方式獲得狀態s,觀測的結果可能相對狀態有必定的誤差,Kalman Filter把這看成一個隱馬爾科夫模型來處理HMM,在這一講中,咱們將更深刻的討論這一問題,將其推廣到更通常的形式,這一問題稱爲部分可觀測
相關文章
相關標籤/搜索