Reinforcement Learning（一）：introduction

時間 2020-12-24

標籤強化學習简体版

原文原文鏈接

A little bit probability theory Random Variable 隨機變量:未知;它的值取決於隨機事件的結果。用大寫字母表示隨機變量，觀察值用小寫字母表示，注意，觀察值是沒有隨機性的。 Probability Density Function (PDF) PDF提供了隨機變量的值與樣本相等的相對可能性，比如下圖的高斯分佈以及離散分佈：滿足以下性質： Expectat

>>阅读原文<<