從「小」培養AI安全意識：OpenAI開源具有安全約束的RL訓練工具

時間 2020-12-30

標籤從「小」培養AI安全意識：OpenAI開源具有安全約束的RL 欄目職業生涯简体版

原文原文鏈接

2019-11-22 11:58:49 強化學習（RL）很強，能訓練出會用雞賊策略的星際宗師級玩家。 △AlphaStar打出cannon rush 但強化學習也很危險，因爲它的套路是無限制探索，常常會出現一些瘋狂危險的嘗試。但在現實環境中，有些試錯是不可接受的。沒有人希望看到，AI通過反覆撞車來學會避免事故發生。要讓強化學習從虛擬環境走向現實生活，強化學習界的高玩OpenAI說：安全

>>阅读原文<<