邊做邊思考,谷歌大腦提出併發RL算法,機械臂抓取速度提高一倍!

選自arXiv 作者:Ted Xiao 等 機器之心編譯 機器之心編輯部 RL 算法通常假設,在獲取觀測值、計算動作並執行期間環境狀態不發生變化。這一假設在仿真環境中很容易實現,然而在真實機器人控制當中並不成立,很可能導致控制策略運行緩慢甚至失效。爲緩解以上問題,最近谷歌大腦與 UC 伯克利、X 實驗室共同提出一種併發 RL 算法,使機器人能夠像人一樣「邊做邊思考」。目前,該論文已被 ICLR 2
相關文章
相關標籤/搜索