學習筆記(02):決勝AI-強化學習實戰系列視頻課程-馬爾科夫決策過程

立即學習:https://edu.csdn.net/course/play/4916/88697?utm_source=blogtoedu 馬爾科夫決策過程 能用馬爾科夫過程的前提條件: 1. 能夠檢測到理想的狀態     如:alphaGo知道什麼樣子是贏 2. 可以多次嘗試 3. 系統的下個狀態只與當前狀態信息有關,耳語更早之前的狀態無關。在決策過程中還與當前採取的動作有關。     馬爾科夫
相關文章
相關標籤/搜索