強化學習(二) —— DQN深度強化學習網絡

DQN,Deep Q Network, 是融合了Q-learning和神經網絡的方法     傳統Q-learning的瓶頸 使用Q-table這樣一個表格來存儲state和action的Q值,在複雜的情境下,狀態可以多到比天上的星星還要多,如果全用表格來存儲,計算機是存儲不下的。並且在如此巨大的表格中搜索對應狀態也是一種很耗時的事情 不過神經網絡對這類事情很在行,我們將狀態和動作當作神經網絡的輸
相關文章
相關標籤/搜索