【論文】強化學習必讀經典論文 | 如何學習強化學習 | 強化學習入門

Christopher JCH Watkins and Peter Dayan. Q-learning. Machine learning, 8(3-4):279–292, 1992. Gerald Tesauro. Temporal difference learning and TD-gammon. Communications of the ACM, 38(3):58–68, 1995. K
相關文章
相關標籤/搜索