DeepMind提出強化學習新算法,教智能體從零學控制

來源:人工智能和大數據 摘要:3月2日,DeepMind發表博客文章,提出一種稱爲SAC-X(計劃輔助控制)的新學習範式,旨在解決讓AI以最少的先驗知識,從頭開始學習複雜控制問題的挑戰。 這在真實環境中成功讓機械臂從頭開始學習拾放物體。SAC-X 是基於從頭開始學習複雜的任務這種想法,即一個智能體首先應該學習並掌握一套基本技能。就像嬰兒在爬行或走路前必須具有協調能力和平衡能力,爲智能體提供與簡單技
相關文章
相關標籤/搜索