深度學習之感性理解-強化學習簡介

深度學習之感性理解-強化學習簡介 基本介紹 爲什麼不能用監督學習 目前最多的應用 強化學習基本結構-actor行動者 總結 基本介紹 簡單來說,就是讓機器根據環境,動作和獎勵,進行自主學習,來更好的完成目的。 舉個例子: 比如王者榮耀,我們的目的是打錢,當你的英雄只有10血的時候(環境),面對野區的怪物,你有2種選擇,一種是逃命(動作),一種就打到死(動作),如果你選擇了逃命,沒打到錢(獎勵),回
相關文章
相關標籤/搜索