揭祕深度強化學習-6狀態空間過大之神經網絡來幫忙

時間 2021-01-02

原文原文鏈接

看完覺得深受啓發的一篇文章，根據自己的理解翻譯過來留以後再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/ DQN 上回書咱們說到，當狀態和動作很小時，我們可以用表結構來記錄Q值。再撿起我們的打磚塊遊戲，它的環境中的狀態，可以被定義爲平板位置，球的位置和方向，每個獨立磚塊的存在性。然而，這個直覺性的表示

>>阅读原文<<