強化學習介紹（RL）

時間 2019-12-07

標籤強化學習介紹简体版

原文原文鏈接

1、簡介機器學習有三大分支，監督學習、無監督學習和強化學習，強化學習是系統從環境學習以使得獎勵最大的機器學習。**人工智能中稱之爲強化學習，在控制論中被稱之爲動態規劃，二者在概念上是等價的。**也被翻譯爲加強學習。web 2、概念不一樣於機器學習的其它兩個分支：它不是無監督學習，由於有回報（Reward）信號反饋是延時的，而不是即時的數據是與時間有關的序列智能體的動做與後續的數據有關

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。