【RL】強化學習的基本思想

在機器學習中,有監督學習和無監督學習的特點是基於已有的數據,去學習數據的分佈或蘊含的其他重要信息。強化學習與上述這二者最顯著的不同在於,首先它不是基於已有的數據進行學習,而是針對一個環境進行學習;另外,它的目標不是學習數據中蘊含的信息,而是尋找能夠在環境中取得更多獎勵的方法。通俗地說,監督學習的目標只是「弄清楚環境是什麼樣的」,而強化學習的目標是「在這個環境中生活得更好」。上述的特點導致了強化學習
相關文章
相關標籤/搜索