強化學習（基本概念）

時間 2021-01-12

原文原文鏈接

概述強化學習（Reinforcement Learning，簡稱RL）是機器學習的一個重要分支。在強化學習中，包含兩種基本的元素：狀態與動作，在某個狀態下執行某種動作，這便是一種策略，學習器要做的就是通過不斷地探索學習，從而獲得一個好的策略。例如：在圍棋中，一種落棋的局面就是一種狀態，若能知道每種局面下的最優落子動作，那就攻無不克/百戰不殆了~ 若將狀態看作爲屬性，動作看作爲標記，易知：監督學習

>>阅读原文<<