強化學習如何入門？

時間 2021-01-09

原文原文鏈接

轉自：https://www.itcodemonkey.com/article/3646.html 來自：量子位（微信號：QbitAI），王小新編譯整理對於大腦的工作原理，我們知之甚少，但是我們知道大腦能通過反覆嘗試來學習知識。我們做出合適選擇時會得到獎勵，做出不切當選擇時會受到懲罰，這也是我們來適應環境的方式。如今，我們可以利用強大的計算能力，在軟件中對這個具體過程進行建模，這就是強化學習。

>>阅读原文<<