強化學習 - 概述

強化學習-概述 課程來自 Udacity-Reinforcement Learning(2017)- 1.Smoov & Curly’s Bogus Journey 的筆記整理 強化學習的」Hello-world」 規則 綠色是目標 紅色是失敗 黑色是牆 start是開始點 你要找到一條從start到目標的路徑 思考 如果給定一個附加概率:按着想法走的0.8,不按想法走的0.2。如果我們假定正確序
相關文章
相關標籤/搜索