機器學習筆記——強化學習

時間 2020-12-30

標籤機器學習強化學習简体版

原文原文鏈接

1.什麼是強化學習？現在的機器學習算法中，大多都是學習怎麼做。而強化學習則是在不斷嘗試的過程中，尋找在特定情境下選擇哪種行爲可以獲得最大回報（Reward）。 .2.強化學習（RL）和監督學習（SL），無監督學習（UL）的關係（1）監督學習就是給一個訓練集（訓練集含有標籤）進行學習，得出一個「函數」，能夠對下一次新的輸入準確預測其輸出。而這種學習方式在交互式學習環境中不太適用，舉個例子：在

>>阅读原文<<