深度丨深度強化學習研究的短時間悲觀與長期樂觀（長文）

時間 2019-12-10

標籤深度強化學習研究短時間悲觀長期樂觀長文简体版

原文原文鏈接

文章來源：機器之心html 深度強化學習是最接近於通用人工智能（AGI）的範式之一。不幸的是，迄今爲止這種方法還不能真正地奏效。在本文中，做者將爲咱們解釋深度強化學習沒有成功的緣由，介紹成功的典型案例，並指出讓深度強化學習奏效的方法和研究方向。算法本文所引文獻大多數來自於 Berkeley、Google Brain、DeepMind 以及 OpenAI 過去幾年的工做，由於它們更容易得到。我不免

>>阅读原文<<