從「小」培養AI安全意識:OpenAI開源具有安全約束的RL訓練工具

2019-11-22 11:58:49 強化學習(RL)很強,能訓練出會用雞賊策略的星際宗師級玩家。   △AlphaStar打出cannon rush 但強化學習也很危險,因爲它的套路是無限制探索,常常會出現一些瘋狂危險的嘗試。   但在現實環境中,有些試錯是不可接受的。沒有人希望看到,AI通過反覆撞車來學會避免事故發生。 要讓強化學習從虛擬環境走向現實生活,強化學習界的高玩OpenAI說:安全
相關文章
相關標籤/搜索