Reinforcement Learning(一):introduction

A little bit probability theory Random Variable 隨機變量:未知;它的值取決於隨機事件的結果。用大寫字母表示隨機變量,觀察值用小寫字母表示,注意,觀察值是沒有隨機性的。 Probability Density Function (PDF) PDF提供了隨機變量的值與樣本相等的相對可能性,比如下圖的高斯分佈以及離散分佈: 滿足以下性質: Expectat
相關文章
相關標籤/搜索