股票操作之強化學習基礎（二）（Q-learning、Sarsa、Sarsa-lambda）

時間 2021-01-08

標籤量化雜文简体版

原文原文鏈接

股票操作之強化學習基礎（二）（Q-learning、Sarsa、Sarsa-lambda） 1. Q-learning Q-learning是強化學習一個比較基礎的算法，很多強化學習的升級算法都是在q-learning的基礎上進行升級的。舉個簡單的例子：一個人在位置1，他需要到位置6，每次可以向左或者向右移動，但是他不知道位置6在他最右邊，他只能自己去摸索如何到位置6。已知條件有在各個狀態下向左

>>阅读原文<<