強化學習導論（Reinforcement Learning：An Introduction）學習筆記（一）

時間 2021-01-02

原文原文鏈接

Introduction 我們在思考學習本質時首先想到的可能就是通過與我們的環境進行交互從而學習。當一個嬰兒玩耍時，揮動着他的手臂，雖然看起來，他沒有明確的老師，但他確實與他的環境有直接的感覺聯繫。並且這種聯繫可以產生大量關於因果，行爲後果以及爲了實現一個目標我們要做什麼等信息。在我們的整個生活中，這種交互無疑是我們瞭解環境和自己的主要知識來源。無論我們是在學習駕駛汽車還是進行對話，我們都非常

>>阅读原文<<