DeepMind提出強化學習新算法，教智能體從零學控制

時間 2020-12-30

原文原文鏈接

來源：人工智能和大數據摘要：3月2日，DeepMind發表博客文章，提出一種稱爲SAC-X（計劃輔助控制）的新學習範式，旨在解決讓AI以最少的先驗知識，從頭開始學習複雜控制問題的挑戰。這在真實環境中成功讓機械臂從頭開始學習拾放物體。SAC-X 是基於從頭開始學習複雜的任務這種想法，即一個智能體首先應該學習並掌握一套基本技能。就像嬰兒在爬行或走路前必須具有協調能力和平衡能力，爲智能體提供與簡單技

>>阅读原文<<