阿爾法狗的祕密:人工智能中的強化學習

在有監督學習(supervised learning)中,訓練數據中包含了數據樣本的目標。 不過現實中可沒有上帝一樣的監督者給出這些目標或答案! 強化學習(reinforcement learning)是人工智能(AI)的一個重要分支,它也是DeepMind的阿爾法狗(AplhaGo)得以實現的一塊基石。 在強化學習中 ,雖然沒有現成的答案,但是代理(agent)仍然必須決定如何行動(action
相關文章
相關標籤/搜索