七月算法強化學習 第六課 學習筆記

強化學習要點大綱: 1.強化學習的難點? 1)credit assignment problem 2)the exploration-exploitation dilemma 2.怎麼定義強化學習? 1)馬爾科夫決策過程 3.怎麼把「眼光」放長遠? 1)discounted future reward 4.怎麼預估「未來收益」? 1)table-based Q-learning 5.狀態空間太大怎
相關文章
相關標籤/搜索