強化學習:從網格世界到自動駕駛

0. Agents, Environments, and Rewards 在過去幾年中,人工智能研究人員發表的許多主要公告都是一門稱爲強化學習(RL)的學科。 最近的突破主要是由經典RL創意的微小轉折所驅動,這得益於強大的計算硬件和利用所述硬件的軟件的可用性。 爲了瞭解現代深度RL模型對於計算的飢餓程度,下表是最近RL進展的非詳盡集合以及完成每項任務所需的計算資源的估計。 請注意,上表中的任務都經
相關文章
相關標籤/搜索