深度學習不相信直覺!

一個比較違反直覺的例子: 一個用於Time-series數據分類的inception網絡,module結構如下, 用6個module組合成一個完整的網絡,參數量爲42萬 用12個module組合成一個完整的網絡,參數量爲90萬 但是1的訓練的速度大概是2的2.5倍,經過查看模型構建代碼發現可能的原因是1中卷積層中stride=1,2中stride=2,得到的feature map大小不同,造成2的
相關文章
相關標籤/搜索