谷歌大腦提出對智能體進行「正向-反向」強化學習訓練,加速訓練過程

原文來源:arXiv 作者:Ashley D. Edwards、Laura Downs、James C. Davidson 「雷克世界」編譯:嗯~是阿童木呀、KABUDA、EVA 在強化學習問題中,關於任務目標的制定,往往需要開發人員花費很多的精力,在本文中,谷歌大腦聯合佐治亞理工學院提出了正向-反向強化學習(Forward-Backward Reinforcement Learning,FBRL
相關文章
相關標籤/搜索