機器學習筆記——強化學習

1.什麼是強化學習? 現在的機器學習算法中,大多都是學習怎麼做。而強化學習則是在不斷嘗試的過程中,尋找在特定情境下選擇哪種行爲可以獲得最大回報(Reward)。   .2.強化學習(RL)和監督學習(SL),無監督學習(UL)的關係 (1)監督學習就是給一個訓練集(訓練集含有標籤)進行學習,得出一個「函數」,能夠對下一次新的輸入準確預測其輸出。而這種學習方式在交互式學習環境中不太適用,舉個例子:在
相關文章
相關標籤/搜索