Part 1 - 自定義gym環境

強化學習的智能體必須和環境交互才能或者reward和observation。對於有些任務,比如機器人的訓練任務,在現實中就不能直接實施,需要先在仿真中確保算法沒有問題,才能遷移到真實機器人上。這樣會節省很多時間,同時也可以減少機器人的磨損。 OpenAI Gym是目前最流行的強化學習虛擬環境。他提供了智能體和環境之間方便易用的接口,使之非常容易的與環境交互、執行動畫、獲取獎勵和生成實時仿真動畫。
相關文章
相關標籤/搜索