令人激動！谷歌推強化學習新框架「多巴胺」，基於TensorFlow，已開源丨附github...

時間 2021-01-14

原文原文鏈接

郭一璞發自凹非寺量子位報道 | 公衆號 QbitAI 上週那個在DOTA2 TI8賽場上「裝逼失敗」的OpenAI Five，背後是強化學習的助推。其實不僅僅是OpenAI Five，下圍棋的AlphaGo和AlphaGo Zero、玩雅達利街機遊戲的DeepMind DQN（deep Q-network），都離不開強化學習（Reinforcement Learning）。現在

>>阅读原文<<