強化學習系列 1:強化學習入門簡介

<1>、強化學習入門簡介 強化學習是一種機器學習方法,對比監督學習,無監督學習,強化學習最開始並沒有標好的標籤,而是通過一次次在環境中嘗試,獲取數據和標籤,然後通過學習自己總結出來的經驗; 一些比較有名的算法, 比如有通過行爲的價值來選取特定行爲的方法, 包括使用表格學習的 Q-learning, sarsa, 使用神經網絡學習的 deep Q network, Sarsa,還有直接輸出行爲的 p
相關文章
相關標籤/搜索