Reinforcement Learning - An Introduction強化學習讀書筆記 Ch9.7-Ch9.11

9.7 非線性函數逼近: 人工神經網絡 前向和循環ANN在強化學習系統中都會使用,但在這裏僅用簡單的前向神經網絡爲例來進行探討。ANN使用的激活函數一般都是S形函數或sigmoid函數,有時也使用非線性整流函數或階梯函數。ANN一般使用SGD進行訓練,並使用反向傳播算法。 在深度網絡中,遇到過擬合問題,防止的方法包括:當模型的性能開始在驗證集上下降時停止訓練(交叉驗證)、修改目標函數限制近似函數的
相關文章
相關標籤/搜索