強化學習 - 概述

強化學習-概述 課程來自 Udacity-Reinforcement Learning(2017)- 1.Smoov & Curly’s Bogus Journey 的筆記整理web 強化學習的」Hello-world」 規則 綠色是目標 紅色是失敗 黑色是牆 start是開始點 你要找到一條從start到目標的路徑 思考 若是給定一個附加機率:按着想法走的0.8,不按想法走的0.2。若是咱們假定
相關文章
相關標籤/搜索