股票操作之強化學習基礎(三)(Deep Q Network、Actor-critic、Policy gradients)

股票操作之強化學習基礎(三)(Deep Q Network、Actor-critic、Policy gradients) 接上一篇文章繼續介紹一些強化學習基礎。 1 DQN(Deep Q Network) DQN是一種融合了神經網絡和Q-learning的方法。那麼DQN提出來的動機是什麼呢?Q-learning算法的核心是學習Q-table,然而真實世界的狀態非常多,這些狀態多到計算機已經無法儲
相關文章
相關標籤/搜索