揭祕深度強化學習-6狀態空間過大之神經網絡來幫忙

看完覺得深受啓發的一篇文章,根據自己的理解翻譯過來留以後再次翻看 原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/ DQN 上回書咱們說到,當狀態和動作很小時,我們可以用表結構來記錄Q值。 再撿起我們的打磚塊遊戲,它的環境中的狀態,可以被定義爲平板位置,球的位置和方向,每個獨立磚塊的存在性。然而,這個直覺性的表示
相關文章
相關標籤/搜索