強化學習總結--周志華西瓜書

16、強化學習 強化學習(Reinforcement Learning,簡稱RL)是機器學習的一個重要分支,前段時間人機大戰的主角AlphaGo正是以強化學習爲核心技術。在強化學習中,包含兩種基本的元素:狀態與動作,在某個狀態下執行某種動作,這便是一種策略,學習器要做的就是通過不斷地探索學習,從而獲得一個好的策略。例如:在圍棋中,一種落棋的局面就是一種狀態,若能知道每種局面下的最優落子動作,那就攻
相關文章
相關標籤/搜索