利用TensorFlow對複雜目標進行強化學習

編者注:請訪問GitHub上這篇文章相應的Python代碼和iPython notebook文件。 更多人工智能業務方面重要的發展請關注2018年4月10-13日人工智能北京大會。 強化學習(RL)是關於訓練智能體來完成一些任務。一般認爲這能夠達成某個目標,例如,我們可能想要訓練機器人來打開一扇門。強化學習可以作爲一個框架,允許機器人用試錯的方法來學習打開門。但是,如果我們更感興趣的是讓智能體不僅
相關文章
相關標籤/搜索