對於強化學習的梳理

時間 2021-01-13

標籤算法強化學習简体版

原文原文鏈接

強化學習（增強學習）概述知識聯繫強化學習是屬於機器學習的一種，機器學習主要分監督學習、非監督學習、半監督學習、增強學習。強化學習的核心邏輯，那就是智能體（Agent）可以在環境（Environment）中根據獎勵（Reward）的不同來判斷自己在什麼狀態（State）下采用什麼行動（Action），從而最大限度地提高累積獎勵。定義及意義、目的描述：強化學習任務通常用馬爾可夫決策過程(

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。