強化學習總結--周志華西瓜書

時間 2021-01-12

原文原文鏈接

16、強化學習強化學習（Reinforcement Learning，簡稱RL）是機器學習的一個重要分支，前段時間人機大戰的主角AlphaGo正是以強化學習爲核心技術。在強化學習中，包含兩種基本的元素：狀態與動作，在某個狀態下執行某種動作，這便是一種策略，學習器要做的就是通過不斷地探索學習，從而獲得一個好的策略。例如：在圍棋中，一種落棋的局面就是一種狀態，若能知道每種局面下的最優落子動作，那就攻

>>阅读原文<<