[Reinforcement Learning] 馬爾可夫決策過程

[Reinforcement Learning] 馬爾可夫決策過程 閱讀目錄 情節性任務 vs. 連續任務 馬爾可夫性 馬爾可夫過程 馬爾可夫獎賞過程 馬爾可夫決策過程 Reference 情節性任務 vs. 連續任務 情節性任務(Episodic Tasks),所有的任務可以被可以分解成一系列情節,可以看作爲有限步驟的任務。 連續任務(Continuing Tasks),所有的任務不能分解,可以
相關文章
相關標籤/搜索