令人激動!谷歌推強化學習新框架「多巴胺」,基於TensorFlow,已開源丨附github...

郭一璞 發自 凹非寺  量子位 報道 | 公衆號 QbitAI 上週那個在DOTA2 TI8賽場上「裝逼失敗」的OpenAI Five,背後是強化學習的助推。 其實不僅僅是OpenAI Five,下圍棋的AlphaGo和AlphaGo Zero、玩雅達利街機遊戲的DeepMind DQN(deep Q-network),都離不開強化學習(Reinforcement Learning)。  現在
相關文章
相關標籤/搜索