強化學習基礎

時間 2021-01-08

原文原文鏈接

基本概念強化學習（reinforcementlearning, RL）是近年來機器學習和智能控制領域的主要方法之一。強化學習關注的是智能體如何在環境中採取一系列行爲，從而獲得最大的累計回報通過強化學習，一個智能體知道在什麼狀態下應該採取什麼行爲。RL是從環境狀態到動作的映射學習，我們把這個映射稱爲策略（Policy）強化學習和監督學習的區別增強學習是試錯學習(Trail-and-error

>>阅读原文<<