從0到1-強化學習篇

時間 2021-01-12

標籤強化學習简体版

原文原文鏈接

https://www.toutiao.com/a6672206404272521731/ 0x01 強化學習在從0到1中已經介紹了基本的思想——從0到1：學安全的你不該懂點AI？，現在再詳細介紹下。強化學習的核心邏輯，那就是智能體（Agent）可以在環境（Environment）中根據獎勵（Reward）的不同來判斷自己在什麼狀態（State）下采用什麼行動（Action），從而最大限度地提高

>>阅读原文<<