凍結網絡層訓練的解釋

博客連接:https://zhuanlan.zhihu.com/p/41313280網絡 在微調(fine-tuning)中,須要肯定凍結的層數和可訓練的層數,主要取決於,數據集類似度和新數據集的大小。原則上,類似度越高,則固定(fix)的層數越多;新數據集越大,不考慮訓練時間的成本,則可訓練更多的層數。而後可能也要考慮數據集自己的類別間差別度,但上面說的規則基本上仍是成立的。圖片 例如,在圖片分
相關文章
相關標籤/搜索