股票操作之強化學習基礎(二)(Q-learning、Sarsa、Sarsa-lambda)

股票操作之強化學習基礎(二)(Q-learning、Sarsa、Sarsa-lambda) 1. Q-learning Q-learning是強化學習一個比較基礎的算法,很多強化學習的升級算法都是在q-learning的基礎上進行升級的。 舉個簡單的例子:一個人在位置1,他需要到位置6,每次可以向左或者向右移動,但是他不知道位置6在他最右邊,他只能自己去摸索如何到位置6。已知條件有在各個狀態下向左
相關文章
相關標籤/搜索