強化學習指南:用Python解決Multi-Armed Bandit問題

Introduction 你在鎮上有一個最喜歡的咖啡館嗎? 當你想喝咖啡時,你可能會去這個地方,因爲你幾乎可以肯定你會得到最好的咖啡。 但這意味着你錯過了這個地方的跨城鎮競爭對手所提供的咖啡。 如果你一個接一個地嘗試所有咖啡的地方,品嚐你生活中更糟糕的咖啡的可能性會非常高! 但話說回來,你有可能找到一個更好的咖啡釀造者。 但是所有這些與強化學習有什麼關係呢? 我很高興你問。 我們的咖啡品嚐實驗中的
相關文章
相關標籤/搜索