從0到1-強化學習篇

https://www.toutiao.com/a6672206404272521731/ 0x01 強化學習在從0到1中已經介紹了基本的思想——從0到1:學安全的你不該懂點AI?,現在再詳細介紹下。 強化學習的核心邏輯,那就是智能體(Agent)可以在環境(Environment)中根據獎勵(Reward)的不同來判斷自己在什麼狀態(State)下采用什麼行動(Action),從而最大限度地提高
相關文章
相關標籤/搜索