人工智能-強化學習(1)

時間 2020-12-23

標籤 sdk 简体版

原文原文鏈接

一、簡介在本節中，我們將學習強化學習（Rl）的基礎知識，它是機器學習的一個分支，涉及採取一系列動作以使報酬最大化。RL基本上對環境一無所知，而是通過探索環境來學習如何做。它使用動作，並接收狀態和獎勵。該代理只能通過操作來更改您的環境。R1的最大困難之一是某些動作需要時間來創造獎勵，而學習這種動態可能具有挑戰性。同樣，環境所獲得的回報與上一個動作無關，而與過去的動作有關。二、強化學習在這

>>阅读原文<<