Learning to Learn: Meta-Critic Networks for Sample Efficient Learning||論文講解

時間 2021-01-02

原文原文鏈接

轉載：https://zhuanlan.zhihu.com/p/27629294 文章：https://arxiv.org/abs/1706.09529 我們人是基於價值觀驅動的動物。我們做什麼不做什麼都是因爲大腦裏面有一杆秤在思考哪個更重要。即使有時候非常感性，也是因爲感性的時候做那件事的價值最大化了。既然人擁有價值觀，我們能不能讓AI也擁有價值觀，並利用價值觀來驅動AI快速學習？答案當然是可

>>阅读原文<<