{機器學習}【Reinforcement Learning】

時間 2020-12-24

原文原文鏈接

常識性知識： RL學習的轉移過程圖示（機器就是agent） agent 選擇一個action輸入到environment中，envirment會反饋（輸出）一個reward和轉移到的state，agent再根據這些信息選擇新的action 基本框架 agent 根據 environment 選擇 action，通過這個action 改變 environment，根據environment的變化

>>阅读原文<<