利用TensorFlow對複雜目標進行強化學習

時間 2020-12-29

原文原文鏈接

編者注：請訪問GitHub上這篇文章相應的Python代碼和iPython notebook文件。更多人工智能業務方面重要的發展請關注2018年4月10-13日人工智能北京大會。強化學習(RL)是關於訓練智能體來完成一些任務。一般認爲這能夠達成某個目標，例如，我們可能想要訓練機器人來打開一扇門。強化學習可以作爲一個框架，允許機器人用試錯的方法來學習打開門。但是，如果我們更感興趣的是讓智能體不僅

>>阅读原文<<