[Reinforcement Learning] 馬爾可夫決策過程

時間 2020-12-30

標籤強化學習算法人工智能深度學習简体版

原文原文鏈接

[Reinforcement Learning] 馬爾可夫決策過程閱讀目錄情節性任務 vs. 連續任務馬爾可夫性馬爾可夫過程馬爾可夫獎賞過程馬爾可夫決策過程 Reference 情節性任務 vs. 連續任務情節性任務（Episodic Tasks），所有的任務可以被可以分解成一系列情節，可以看作爲有限步驟的任務。連續任務（Continuing Tasks），所有的任務不能分解，可以

>>阅读原文<<