邊做邊思考，谷歌大腦提出併發RL算法，機械臂抓取速度提高一倍！

時間 2021-01-17

原文原文鏈接

選自arXiv 作者：Ted Xiao 等機器之心編譯機器之心編輯部 RL 算法通常假設，在獲取觀測值、計算動作並執行期間環境狀態不發生變化。這一假設在仿真環境中很容易實現，然而在真實機器人控制當中並不成立，很可能導致控制策略運行緩慢甚至失效。爲緩解以上問題，最近谷歌大腦與 UC 伯克利、X 實驗室共同提出一種併發 RL 算法，使機器人能夠像人一樣「邊做邊思考」。目前，該論文已被 ICLR 2