24分鐘讓AI跑起飛車類遊戲

本文由雲+社區發表html 做者:WeTest小編git WeTest 導讀 本文主要介紹如何讓AI在24分鐘內學會玩飛車類遊戲。咱們使用Distributed PPO訓練AI,在短期內能夠取得不錯的訓練效果。github 本方法的特色:web 純遊戲圖像做爲輸入 不使用遊戲內部接口 可靠的強化學習方法 簡單易行的並行訓練 1. PPO簡介 PPO(Proximal Policy Optimiza
相關文章
相關標籤/搜索