{機器學習}【Reinforcement Learning】

常識性知識: RL學習的轉移過程圖示(機器就是agent)   agent 選擇一個action輸入到environment中,envirment會反饋(輸出)一個reward和轉移到的state,agent再根據這些信息選擇新的action 基本框架 agent 根據 environment 選擇 action,通過這個action 改變 environment,根據environment的變化
相關文章
相關標籤/搜索