論文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applicationsgit
(1) 直接對channel進行裁剪,這種隨機砍掉一些channel,也太暴力了吧,砍多了效果確定很差,想一想都知道。github
(2) 減小輸入圖像的分辨率,也就是減少輸入的尺寸大小。網絡
輸入M個channel,那麼輸出也是M個channel,每個channel都是由一個kernel在一個channel卷積之後獲得的結果,不在是和全部的輸入相關了。這也就是爲何名字叫作depthwise separable(深度級的分離,channel的分離)。google
可是咱們發現輸出只有M個channel,而咱們想要輸出N個channel,這個時候咱們應該想到1*1的convolution,這個時候的卷積就是full convolution。這個時候輸出的每個channel都和輸入有關了,至關於輸入的加權求和。因此1x1的卷積有聯合(combine)的做用。3d
求和的左半部分,表示depthwise separable的計算量,能夠看到輸出爲M個channel,每一個輸出channel只和一個channel有關。blog
求和的有半部分,表示1x1 pointwise convolution,能夠看到每個輸出channel,都和M個輸入有關(M個輸入的加權求和)。ci
計算量較少比例get
上面公式能夠看到直接對輸入的M個channel進行的壓縮(隨機採樣)it
上面公式能夠看到對不只對輸出的channel進行了採樣,對輸入圖像的分辨率也進行了減少。io