學習筆記(02):決勝AI-強化學習實戰系列視頻課程-馬爾科夫決策過程

時間 2021-01-11

原文原文鏈接

立即學習:https://edu.csdn.net/course/play/4916/88697?utm_source=blogtoedu 馬爾科夫決策過程能用馬爾科夫過程的前提條件： 1. 能夠檢測到理想的狀態如：alphaGo知道什麼樣子是贏 2. 可以多次嘗試 3. 系統的下個狀態只與當前狀態信息有關，耳語更早之前的狀態無關。在決策過程中還與當前採取的動作有關。馬爾科夫

>>阅读原文<<