Open.ai新算法:一小時內訓練AI系統後空翻,僅需900Bit的人類反饋數據

編 | 王藝python 編者按: 6月11日,Open.ai官方博客發文,宣佈其與DeepMind安所有門合做開發的最新算法,該算法使用少許人爲反饋進行強化學習,並可以處理更復雜的任務。僅需900bit的人類反饋,系統便學會了後空翻,須要人類參與的時間也從70小時將至1小時,該技術還可以被應用在更多其餘方面,目前在虛擬機器人以及Atari平臺的遊戲上已經接受普遍測試。web 構建安全AI系統的關
相關文章
相關標籤/搜索