強化學習(基本概念)

概述 強化學習(Reinforcement Learning,簡稱RL)是機器學習的一個重要分支。在強化學習中,包含兩種基本的元素:狀態與動作,在某個狀態下執行某種動作,這便是一種策略,學習器要做的就是通過不斷地探索學習,從而獲得一個好的策略。例如:在圍棋中,一種落棋的局面就是一種狀態,若能知道每種局面下的最優落子動作,那就攻無不克/百戰不殆了~ 若將狀態看作爲屬性,動作看作爲標記,易知:監督學習
相關文章
相關標籤/搜索