強化學習(一):簡單的DQN理解

強化學習(reinforcement learning)是一種介於監督學習和非監督學習之間的特殊任務。它並非像監督學習一樣對於每一個數據都有着明確的標記信息,也不像無監督學習那樣全無標記信息。強化學習有着相對稀疏的反饋標註,即獎勵(Reward)。進行學習過程的代理Agent就從這些獎勵中,明白自己行爲的對錯程度,學習如何與環境Environment互動。 在目前深度學習領域長足進步的當下,將深度
相關文章
相關標籤/搜索