強化學習通俗導論(一):什麼是強化學習

1. 定義 強化學習是機器學習的一個重要分支,是多學科多領域交叉的一個產物,它的本質是解決 decision making 問題,即自動進行決策,而且能夠作連續決策。算法 它主要包含四個元素,agent,環境狀態,行動,獎勵, 強化學習的目標就是得到最多的累計獎勵。網絡 讓咱們以小孩學習走路來作個形象的例子:架構 小孩想要走路,但在這以前,他須要先站起來,站起來以後還要保持平衡,接下來還要先邁出一
相關文章
相關標籤/搜索