「強化學習之父」薩頓:預測學習馬上要火,AI將幫我們理解人類意識

本文來自AI新媒體量子位(QbitAI) 地處加拿大埃德蒙頓的阿爾伯塔大學(UAlberta)可謂是強化學習重鎮,這項技術的締造者之一薩頓(Rich Sutton)在這裏任教。 △ 薩頓 薩頓常被稱爲「強化學習之父」,他對強化學習的重要貢獻包括時序差分學習和策略梯度方法。 如果你研究過強化學習,可能對他和巴爾託(Andrew Barto)合著的一本書很熟悉:《強化學習導論》(Reinforceme
相關文章
相關標籤/搜索