阿爾法狗的祕密：人工智能中的強化學習

時間 2020-12-29

原文原文鏈接

在有監督學習（supervised learning）中，訓練數據中包含了數據樣本的目標。不過現實中可沒有上帝一樣的監督者給出這些目標或答案！強化學習（reinforcement learning）是人工智能（AI）的一個重要分支，它也是DeepMind的阿爾法狗（AplhaGo）得以實現的一塊基石。在強化學習中，雖然沒有現成的答案，但是代理（agent）仍然必須決定如何行動（action

>>阅读原文<<