如何設計神經網絡結構
- start small
- gradually increase the model size
- small parameter, deep is better than wider; deep network is hard to optimize, 使用resnet的思想進行優化
- kernel size : 3*3 and 1*1 work the best
- stride :
- 保留空間分辨率使用 stride = 1
- 下采樣使用stride = 2
- 上採樣使用stride = 1 or 2
- batch Size:
- 一般使用32爲batch
- Noisy gradient : larger batch
- local minima : smaller batch
- 劃分數據集
- 大的數據集如10W+: 99% train 1% test and valid
- 小的數據集如1W: 80% train 20% test and valid
歡迎關注本站公眾號,獲取更多信息