python實現強化學習

時間 2020-01-31

原文原文鏈接

強化學習強化學習(reinforcement learning)，又稱再勵學習、評價學習，是一種重要的機器學習方法，強化學習是智能體（Agent）以「試錯」的方式進行學習，經過與環境進行交互得到的獎賞指導行爲，目標是使智能體得到最大的獎賞，強化學習不一樣於鏈接主義學習中的監督學習，主要表如今強化信號上，強化學習中由環境提供的強化信號是對產生動做的好壞做一種評價(一般爲標量信號)，而不是告訴強化學

>>阅读原文<<