python實現強化學習

強化學習 強化學習(reinforcement learning),又稱再勵學習、評價學習,是一種重要的機器學習方法,強化學習是智能體(Agent)以「試錯」的方式進行學習,經過與環境進行交互得到的獎賞指導行爲,目標是使智能體得到最大的獎賞,強化學習不一樣於鏈接主義學習中的監督學習,主要表如今強化信號上,強化學習中由環境提供的強化信號是對產生動做的好壞做一種評價(一般爲標量信號),而不是告訴強化學
相關文章
相關標籤/搜索