強化學習如何入門?

轉自:https://www.itcodemonkey.com/article/3646.html 來自:量子位(微信號:QbitAI),王小新編譯整理 對於大腦的工作原理,我們知之甚少,但是我們知道大腦能通過反覆嘗試來學習知識。我們做出合適選擇時會得到獎勵,做出不切當選擇時會受到懲罰,這也是我們來適應環境的方式。如今,我們可以利用強大的計算能力,在軟件中對這個具體過程進行建模,這就是強化學習。
相關文章
相關標籤/搜索