DRL(一)——Supervised Learning and Imitation

時間 2021-01-02

原文原文鏈接

寫在前面今天開始學習DRL了，其實RL還沒完全看完…… 大概總結一下感覺這節課講的內容是比較初級的一些方法，從標題就看得出來，Supervised Learning，和 Imitation。教授先是講了imitation，就是通過人類的training，建立data，然後智能體用這個data來模仿。這樣當然有很多問題，比如training中的情況可能不會包含所有的情況，總是會有新的情況出現；

>>阅读原文<<