揭祕深度強化學習神經網絡(DQN)

文中使用的詞彙及含義 agent: 在人工智能領域,通常用 Agent 來表示一個具有行爲能力的物體,好比機器人,無人車,人等等。 reward: 反饋值,作出一個動做獲得相應的回報,好比超級馬里奧,跳一下吃到 dollar , 不錯,得分,那麼這一下操做獲得的反饋就能夠是正的,相反跳一下碰到蘑菇怪了,game over ,那這一下操做的反饋就能夠是負的 action: 操做,行爲,好比上面 re
相關文章
相關標籤/搜索