Imitation Learning 模仿學習

時間 2021-07-14

標籤 Imitation Learning Behavioral Cloning Inverse Reinforcement Learning Apprenticeship Learning 简体版

原文原文鏈接

We want RL Algorithm that Perform Optimization(優化) Delayed consequences(延遲結果) Exploration(探索) Generation(泛化) And do it all statistically and computationally efficiently(統計性地，計算高效性地執行以上過程) Generalizati

>>阅读原文<<