TensorFlow使用不一樣的學習率

使用場景 有時候咱們須要爲不一樣的網絡層設置不一樣的學習率。好比在fine-tune的時候,一個best practice就是在ImageNet上預訓練的骨幹部分使用較小的學習率,而新添加的部分使用較大的學習率。如圖所示的計算圖譜,若是咱們但願骨幹部分的殘差網絡學習率小一點,而新增長的aspp模塊學習率稍大一點。 雖然TensorFlow對使用不一樣的學習率沒有提供比較便捷的支持,但使用TF提供的
相關文章
相關標籤/搜索