強化學習筆記(1):Q-Learning

1. 強化學習基本概念 考慮下面這個例子:假如我們想讓一隻老鼠學會走迷宮,往往會在迷宮的幾個關鍵地點放上奶酪,老鼠每次走到關鍵點就會獲得獎勵,久而久之,老鼠就能學會快速找到迷宮出口,這就是強化學習的一個例子。 強化學習的關鍵要素包括:環境(environment),回報(reward),動作(action),狀態(state) 。在上述例子中,environment就是老鼠所處的迷宮,迷宮中的奶酪
相關文章
相關標籤/搜索