強化學習之Eligibility Traces

Eligibility Traces  Eligibility traces是Reinforcement Learning中的一個基本機制。TD( λ )算法中的 λ 指的就是對Eligibility traces的運用。幾乎所有的TD算法,包括Q Learning、Sarsa算法,可以結合Eligibility trace得到一個通用的能更有效學習的方法。   可以從兩種視角看待Eligibil
相關文章
相關標籤/搜索