語義分割:給圖像的每一個像素點標註類別。一般認爲這個類別與鄰近像素類別有關,同時也和這個像素點歸屬的總體類別有關。利用圖像分類的網絡結構,能夠利用不一樣層次的特徵向量來知足斷定需求。現有算法的主要區別是如何提升這些向量的分辨率,以及如何組合這些向量。python
超參數:epochs=50,lr=0.001,optim=SGD,momentum=0.7u
數據集:Bag,resize(160,160),batch_size=4
注意vgg16正確的層號,每層最後一個是池化。git
feats = list(models.vgg16(pretrained=True).features.children()) self.feat1 = nn.Sequential(*feats[0:5]) self.feat2 = nn.Sequential(*feats[5:10]) self.feat3 = nn.Sequential(*feats[10:17]) self.feat4 = nn.Sequential(*feats[17:24]) self.feat5 = nn.Sequential(*feats[24:31])
1*1卷積+標籤收縮(到對應層尺寸)github
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5 | 8 | 82 | 90 | 1.1 |
4 | 8 | 86 | 93 | 1.0 |
3 | 6 | 80 | 90 | 1.0 |
1*1卷積+上採樣(2倍)+標籤收縮算法
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5->4 | 8 | 72 | 85 | 1.1 |
4->3 | 6 | 80 | 90 | 1.0 |
3->2 | 5 | 78 | 88 | 1.0 |
1*1卷積+轉置卷積(2倍)+標籤收縮網絡
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5->4 | 8 | 79 | 89 | 1.1 |
4->3 | 6 | 84 | 92 | 1.0 |
3->2 | 5 | 80 | 90 | 1.0 |
反池化(2倍)+1*1卷積+標籤收縮dom
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5->4 | 8 | 84 | 92 | 1.1 |
4->3 | 7 | 87 | 94 | 1.1 |
3->2 | 5 | 84 | 91 | 1.0 |
池化(stride=1)+2*2卷積(stride=1,padding=1)+標籤收縮ide
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5->4 | 8 | 84 | 92 | 1.1 |
4->3 | 7 | 89 | 95 | 1.0 |
3->2 | 7 | 80 | 90 | 1.1 |
上採樣(逐層,直到原始尺寸)+1*1卷積+求和(FCN)函數
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5 | 8 | 82 | 91 | 1.2 |
5+4 | 8 | 88 | 94 | 1.2 |
5+4+3 | 9 | 88 | 94 | 1.2 |
上採樣(逐層,直到原始尺寸)+1*1卷積+拼接(UNET')性能
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5 | 8 | 82 | 91 | 1.2 |
5+4 | 9 | 87 | 93 | 1.2 |
5+4+3 | 9 | 89 | 94 | 1.1 |
上採樣(直接達到原始尺寸)+1*1卷積+拼接(PSPNET')測試
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5 | 8 | 84 | 92 | 1.2 |
5+4 | 9 | 87 | 93 | 1.2 |
5+4+3 | 8 | 88 | 94 | 1.2 |
反池化(逐層)+1*1卷積+上採樣(SegNet')
網絡層 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
5 | 8 | 82 | 91 | 1.1 |
5->4 | 8 | 88 | 94 | 1.1 |
5->4->3 | 9 | 89 | 95 | 1.1 |
epochs=100,lr=3e-3
網絡 | 單epoch時間(s) | mIOU(%) | pixel-acc(%) | GPU(G) |
---|---|---|---|---|
PSPNET(反池化) | 8 | 91 | 96 | 1.1 |
PSPNET(池化,stride=1) | 9 | 91 | 96 | 1.2 |