圖像分割的衡量指標詳解

轉載自:http://m.blog.csdn.net/u011771047/article/details/72777349

                 http://blog.csdn.net/u014593748/article/details/71698246?fps=1&locationNum=5


補充說明:  圖像分割(Semantic Segmentation)

       圖像分割也是一項有意思的研究領域,它的目的是把圖像中各種不同物體給用不同顏色分割出來,如下圖所示,其平均精度(mIoU,即預測區域和實際區域交集除以預測區域和實際區域的並集),也從最開始的FCN模型(圖像語義分割全連接網絡,該論文獲得計算機視覺頂會CVPR2015的最佳論文的)的62.2%,到DeepLab框架的72.7%,再到牛津大學的CRF as RNN的74.7%。該領域是一個仍在進展的領域,仍舊有很大的進步空間。



一、爲論文閱讀筆記,不當之處,敬請指正。 

A Review on Deep Learning Techniques Applied to Semantic Segmentation:原文鏈接

5.1度量標準

爲何需要語義分割系統的評價標準?

  • 爲了衡量分割系統的作用及貢獻,其性能需要經過嚴格評估。並且,評估須使用標準、公認的方法以保證公平性。
  • 系統的多個方面需要被測試以評估其有效性,包括:執行時間、內存佔用、和精確度。
  • 由於系統所處背景及測試目的的不同,某些標準可能要比其他標準更加重要,例如,對於實時系統可以損失精確度以提高運算速度。而對於一種特定的方法,儘量提高所有的度量性能是必須的。

5.1.1 執行時間

速度或運行時間是一個非常有價值的度量,因爲大多數系統需要保證推理時間可以滿足硬實時的需求。某些情況下,知曉系統的訓練時間是非常有用的,但是這通常不是非常明顯,除非其特別慢。在某種意義上說,提供方法的確切時間可能不是非常有意義,因爲執行時間非常依賴硬件設備及後臺實現,致使一些比較是無用的。

然而,出於重用和幫助後繼研究人員的目的,提供系統運行的硬件的大致描述及執行時間是有用的。這可以幫助他人評估方法的有效性,及在保證相同環境測試最快的執行方法。

5.1.2 內存佔用

內存是分割方法的另一個重要的因素。儘管相比執行時間其限制較鬆,內存可以較爲靈活地獲得,但其仍然是一個約束因素。在某些情況下,如片上操作系統及機器人平臺,其內存資源相比高性能服務器並不寬裕。即使是加速深度網絡的高端圖形處理單元(GPU),內存資源也相對有限。以此來看,在運行時間相同的情況下,記錄系統運行狀態下內存佔用的極值和均值是及其有價值的。

5.1.3 精確度

圖像分割中通常使用許多標準來衡量算法的精度。這些標準通常是像素精度及IoU的變種,以下我們將會介紹常用的幾種逐像素標記的精度標準。爲了便於解釋,假設如下:共有k+1個類(從L0Lk,其中包含一個空類或背景),pij表示本屬於類i但被預測爲類j的像素數量。即,pii表示真正的數量,而pij  pji則分別被解釋爲假正假負,儘管兩者都是假正與假負之和。

  • Pixel Accuracy(PA,像素精度):這是最簡單的度量,爲標記正確的像素佔總像素的比例。 
    PA=ki=0piiki=0kj=0pij
  • Mean Pixel Accuracy(MPA,均像素精度):是PA的一種簡單提升,計算每個類內被正確分類像素數的比例,之後求所有類的平均。 
    MPA=1k+1i=0kpiikj=0pij
  • Mean Intersection over Union(MIoU,均交併比):爲語義分割的標準度量。其計算兩個集合的交集和並集之比,在語義分割的問題中,這兩個集合爲真實值(ground truth)和預測值(predicted segmentation)。這個比例可以變形爲正真數(intersection)比上真正、假負、假正(並集)之和。在每個類上計算IoU,之後平均。 

    MIoU=1k+1i=0kpiikj=0pij+kj=0pjipii

  • Frequency Weighted Intersection over Union(FWIoU,頻權交併比):爲MIoU的一種提升,這種方法根據每個類出現的頻率爲其設置權重。 

    FWIoU=1ki=0kj=0piji=0kpiikj=0pij+kj=0pjipii

    在以上所有的度量標準中,MIoU由於其簡潔、代表性強而成爲最常用的度量標準,大多數研究人員都使用該標準報告其結果。

直觀理解

如下圖所示,橢圓A代表真實值,橢圓B代表預測值。橙色部分爲A與B的交集,即真正(預測爲1,真實值爲1)的部分,綠色部分表示假負(預測爲0,真實爲1)的部分,黃色表示假正(預測爲1,真實爲0)的部分,兩個橢圓之外的白色區域表示真負(預測爲0,真實值爲0)的部分。表示綠色+橙色+黃色爲A與B的並集。

  • MP計算橙色與(橙色與黃色)的比例。
  • MIoU計算的是計算A與B的交集(橙色部分)與A與B的並集(綠色+橙色+黃色)之間的比例,在理想狀態下A與B重合,兩者比例爲1 。 


二、基礎知識:

這部分是基礎知識,熟悉的可直接跳過

如圖所示,集合A:真實值;集合B:預測值。 

這裏寫圖片描述 
針對預測值和真實值之間的關係,我們可以將樣本分爲4類: 
  真正值(TP):預測值爲1,真實值爲1;橙色,A∩B 
  真負值(TN):預測值爲0,真實值爲0;白色,~(A∪B) 
  假正值(FP):預測值爲1,真實值爲0;黃色,B-(A∩B) 
  假負值(FN):預測值爲0,真實值爲1;綠色,A-(A∩B)

# 爲方便記憶,可以這樣理解:
# TP:T(預測對了true) P(預測爲正樣本positive);真的正值,說明被預測爲正樣本,預測是真的,即真實值爲正樣本
# TN:T(預測對了true) P(預測爲負樣本negative);真的負值,說明被預測爲負樣本,預測是真的,即真實值爲負樣本
# FP:T(預測錯了false)P(預測爲正樣本positive);假的正直:說明被預測爲正樣本,但預測是假的,即真實值爲負樣本
# FN:T(預測錯了false)P(預測爲負樣本negative);假的負值,說明被預測爲負樣本,但預測是假的,即真實值爲正樣

召回率: 正確率: 
針對預測樣本而言,預測爲正例的樣本中真正正例的比例: 
預測爲正的有兩種: 
1、正樣本被預測爲正 TP 
2、負樣本被預測爲正 FP 

所以精確率:precesion = TP/(TP+FP)    其中分母預測爲正樣本數量。

針對原來的樣本而言,表示樣本中有多少正例被預測正確了(預測爲正例的真是整理佔所有真實正例的比例): 
1、原來的正樣本被預測爲正樣本 TP 
2、原來的正樣本被預測爲負樣本 FN 

所以召回率爲:racall = TP/(TP+FN)      其中分母表示原來樣本中的正樣本數量。

▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶▶

三、圖像分割的衡量指標:

  圖像分割中通常有很多中衡量標準,也有很多中版本的pixel-accuracy 和IoU,這裏我們介紹目前最常用的幾種。爲了方便解釋,我們重述下定義:假設有k+1個類別(從L0Lk包括一個背景或者空類 別)Pij爲類別i的像素被預測爲類別j的個數,換句話說,也就是Pii就是被正確分類(TP)的像素個數,PijPji通常被解釋爲FP和FN,儘管兩者都是假正和假負之和。

像素精確度(pixel accuracy,PA)

  這是最簡單的指標,用來計算被正確分類的像素個數和總像素數之間的比例: 

PA=ki=Piiki=kj=Pij

爲了方便理解,展開的形式爲: 
PA=P00+P11+...+Pkk(P00+P01+...+P0k)+(P10+...+P1k)+...+(Pk0+...+Pkk)
=P00+P11+...+Pkk(P00+P10+...+Pk0)+(P01+P11...+Pk1)+....+(P0k+P1k...+Pkk)

  其中,分子中的每一項均爲各個類別正確分類的像素個數;分母中的每一個括號項中爲預測爲該類別的所有像素數, 
因此之和爲所有像素數(TP+(FN+FP))。

平均像素精確度(Mean pixel Accuracy,MPA),這是在PA基礎上做了微整提升,爲類別內像素正確分類概率的平均值: 
  

PA=1k+1i=kPiikj=Pij

  爲了比較和PA的不同,展開: 
  
MPA=1k+1P00(P00+P01+...+P0k)+P11(P10+P11+...+P1k)+...+Pkk(Pk0+Pk1+...+Pkk)

 這裏的每一個加法項均爲每個類別內部像素正確分類的比例,所有類別的正確分類概率之和最後取平均值。 
  
平均交併比(Mean Intersection over Union,MIoU) 
  這是一個標準的衡量metric ,計算兩個集合之間交集和並集的比例,在圖像分割中,就是真實值(Ground Truth)和預測值兩個集合。可以轉換爲TP(intersection)與TP ,FN ,FP之和(union)的比值。先計算每個類內的交併比,然後計算均值。 
  
MIoU=1k+1i=kPiikj=Pij+kj=PjiPii

  展開 
 
MIoU=1k+1P00(P00+P01+...+P0k)+(P00+P10+...+Pk0)P00+...+
Pkk(Pk0+Pk1+...+Pkk)+(P0k+P1k+...+Pkk)Pkk

  對式中的每一個加法項是針對每一個類別進行計算平均交併比,其中分母中的第一項爲真實值(GT)中該類的像素個數,第二項爲預測值中預測爲該類的像素個數,前兩項中間存在一個交集:真實值中的也在預測值中,因此減去一個第三項。 
  對所有的類別分別求交併比,然後計算均值,即爲MIoU.

加權交併比(Frequency Weighted Intersection over Union,FWIoU)

        這是在MIoU上的基礎上做稍微的提升,對每一個類根據出現的頻率爲其設置權重: 

  

FWIoU=1ki=kj=Piji=kkj=PijPiikj=Pij+kj=PjiPii

  展開: 
FWIoU=1ki=kj=Pij(P00P00+P01P00+...+P0kP00(P00+P01+...+P0k)+(P00+P10+...+Pk0)P00+...+Pk0Pkk+Pk1Pkk+...+PkkPkk(Pk0+Pk1+...+Pkk)+(P0k+P1k+...+Pkk)Pkk) =1ki=kj=Pij(P00(P00+P01+...+P0k)(P00+P01+...+P0k)+(P00+P10+...+Pk0)P00+...+Pkk(Pk0+Pk1+...+Pkk)(Pk0+Pk1+...+Pkk)+(P0k+P1k+...+Pkk)Pkk) =P00+P01+...+P0kki=kj=PijP00(P00+P01+...+P0k)+(P00+P10+...+Pk0)P00+...+Pk0+Pk1+...$$+Pkkki=kj=PijPkk(Pk0+Pk1+...+Pkk)+(P0k+P1k+...+Pkk)Pkk

  從第二個等號已經可以看出,乘法的第一個乘法因子的分母爲全部的像素個數;乘法的第二項中每一項的分子中,第二個乘法因子(P00+P00+P01+...+P0k)表示在真實值中(GT),該類別(此處爲0)的所有像素個數; 
  因此第三個等號整理後,兩者的比例P00+P01+...+01+...+P0kki=kj=Pj=

相關文章
相關標籤/搜索