OpenAI開發的分級強化學習算法旨在解決高級操作

來源:ATYUN AI平臺  我們已經開發了一種分層強化學習算法,它學習用於解決一組任務的高級操作,可以快速解決需要數千個時間步長的任務。我們的算法應用於一組導航問題時,會發現一組用於在不同方向上進行走路和爬行的高級動作,這使智能體能夠快速掌握新的導航任務。 人類解決複雜挑戰的方法是將它分解成很多小的易於控制的部分。例如,煎餅由一系列高層次的行動組成,如和麪,加蛋,入鍋等。人類能夠通過對這些已經學
相關文章
相關標籤/搜索