DRL(一)——Supervised Learning and Imitation

寫在前面 今天開始學習DRL了,其實RL還沒完全看完…… 大概總結一下 感覺這節課講的內容是比較初級的一些方法,從標題就看得出來,Supervised Learning,和 Imitation。 教授先是講了imitation,就是通過人類的training,建立data,然後智能體用這個data來模仿。這樣當然有很多問題,比如training中的情況可能不會包含所有的情況,總是會有新的情況出現;
相關文章
相關標籤/搜索