深度丨深度強化學習研究的短時間悲觀與長期樂觀(長文)

文章來源:機器之心html 深度強化學習是最接近於通用人工智能(AGI)的範式之一。不幸的是,迄今爲止這種方法還不能真正地奏效。在本文中,做者將爲咱們解釋深度強化學習沒有成功的緣由,介紹成功的典型案例,並指出讓深度強化學習奏效的方法和研究方向。算法 本文所引文獻大多數來自於 Berkeley、Google Brain、DeepMind 以及 OpenAI 過去幾年的工做,由於它們更容易得到。我不免
相關文章
相關標籤/搜索