強化學習概覽

什麼是強化學習 強化學習是機器學習中的一個分支, 機器通過不斷地嘗試, 從錯誤中學習, 最後找到規律, 學會了達到目的的方法. Alpha go就是強化學習的應用實例。 強化學習的設置由兩部分組成,一個是智能體(agent),即強化學習算法;另一個是環境,指的是agent執行動作時所處的場景(如遊戲本身)。環境首先向智能體發送一個狀態,然後智能體基於其知識採取動作來響應該狀態。之後,環境發送下一個
相關文章
相關標籤/搜索