站在AI與神經科學交叉點上的強化學習

來源: 混沌巡洋艦 一,強化學習概述 讓機器來決策,首先體現在如何模仿人類的決策。對於決策這個問題, 對於人類是困難的, 對於機器就更難。 而強化學習, 就是一套如何學習決策的方法論。 強化學習最初的體現就是試錯學習, 因此理解強化學習的第一個層次就是如何通過一個簡單的機制在不確定的環境下進行試錯, 掌握有用的信息。 在這個框架下, 我們需要掌握的只有兩個基本要素, 一個是行爲,一個是獎勵。 在這
相關文章
相關標籤/搜索