股票操作之強化學習基礎（三）（Deep Q Network、Actor-critic、Policy gradients）

時間 2021-01-15

原文原文鏈接

股票操作之強化學習基礎（三）（Deep Q Network、Actor-critic、Policy gradients）接上一篇文章繼續介紹一些強化學習基礎。 1 DQN（Deep Q Network） DQN是一種融合了神經網絡和Q-learning的方法。那麼DQN提出來的動機是什麼呢？Q-learning算法的核心是學習Q-table，然而真實世界的狀態非常多，這些狀態多到計算機已經無法儲

>>阅读原文<<