強化學習介紹(RL)

1、簡介 機器學習有三大分支,監督學習、無監督學習和強化學習,強化學習是系統從環境學習以使得獎勵最大的機器學習。**人工智能中稱之爲強化學習,在控制論中被稱之爲動態規劃,二者在概念上是等價的。**也被翻譯爲加強學習。web 2、概念 不一樣於機器學習的其它兩個分支: 它不是無監督學習,由於有回報(Reward)信號 反饋是延時的,而不是即時的 數據是與時間有關的序列 智能體的動做與後續的數據有關
相關文章
相關標籤/搜索