人工智能-強化學習(1)

一、簡介 在本節中,我們將學習強化學習(Rl)的基礎知識,它是機器學習的一個分支,涉及採取一系列動作以使報酬最大化。RL基本上對環境一無所知,而是通過探索環境來學習如何做。 它使用動作,並接收狀態和獎勵。 該代理只能通過操作來更改您的環境。R1的最大困難之一是某些動作需要時間來創造獎勵,而學習這種動態可能具有挑戰性。 同樣,環境所獲得的回報與上一個動作無關,而與過去的動作有關。 二、強化學習 在這
相關文章
相關標籤/搜索