cs231n筆記(8++)——扔掉層(drop)

簡單來說就是將一些神經元隨機失活,防止過擬合。注意dropout層的本質是爲了減少過擬合的的,是通過隨機不激活一部分神經元實現的(每次不激活的部分並不相同),而不是爲了去除掉不激活的神經元。 具體理解: Dropout是指在模型訓練時隨機讓網絡某些隱含層節點的權重不工作,不工作的那些節點可以暫時認爲不是網絡結構的一部分,但是它的權重得保留下來(只是暫時不更新而已),因爲下次樣本輸入時它可能又得工作
相關文章
相關標籤/搜索