這篇論文介紹的是,若是快速的找到的多是物體目標的區域,不像使用傳統的滑動窗口來暴力進行區域識別.這裏是使用算法從多個維度對找到圖片中,可能的區域目標,減小目標碎片,提高物體檢測效率. 下面是這篇文章的筆記:算法
圖片是分層次的,好比下圖中a:spa
沙拉和匙在沙拉碗裏,而碗又在桌子上,另外桌子和木頭有關或者說桌子和桌子上的全部東西有關.因此圖片中的目標是有層次的. 圖片分割應該按層次來,也不存在使用單個策略這樣通用的方法來進行圖片分割,因此對圖片分割都是基於多個策略,可是這樣又會在合併區域的時候產生衝突. 好比說上圖中的b圖,貓可使用顏色進行分割,可是它們的紋理是同樣的. 相反的 ; 圖C中的變色龍和周圍的葉子在顏色上是類似的,可是在紋理上確實不一樣的.最後,圖d中,汽車輪子和汽車在顏色和紋理上都是不一樣的,可是和汽車的形狀吻合度很高. 對於這三個圖,採用他們其中的一種視覺特徵是沒法來對它們進行圖片分割的.blog
在這篇文章中,做者結合直覺分割算法和窮舉搜索算法來提出這個selective search(選擇性搜索)算法,使用直覺分割算法是但願達到結合圖片的結構層次從下至上來分割,來產生目標區域. 使用窮舉搜索算法的目的是獲得全部多是目標的區域. 選擇性搜索算法,使用的是多樣化在抽樣算法圖片
在這篇文章中,做者主要從下面問題來介紹選擇性策略:ci
1. 選擇性策略採用的是什麼樣的多樣性策略來自適應分割圖片?.io
2. 選擇性策略在圖片中生成高質量小目標的效率怎麼樣?效率
3. 可否使用選擇性策略來結合分類模型和外觀模型來進行目標識別?原理
1. 適用全部尺寸.sed
目標能夠以任意尺寸出如今圖片中,甚至有些目標和其餘目標的邊界並不明顯,面對這些問題,選擇性算法會對全部的目標尺寸進行記錄,就像下圖同樣,select
能夠很容易使用層次算法來實現.
2. 多樣化.
單個的策略沒法去處理各類各樣差別化區域. 因此使用了多種策略好比顏色空間,紋理,吻合度等.
3. 快速的計算.
選擇性算法使用的是按層次合併算法(Hierarchical Grouping),基本思路是這樣:
經過對一張圖片從低向上進行層次劃分,當咱們劃出一個大區域時,繼續在這個大區域中迭代劃分,直到劃不出區域爲止.並將這個過程當中產生的全部的區域記錄下來,
在經過顏色,紋理,吻合度,大小來將這些細碎的區域進行合併.這種方式不須要設定滑動窗口,滑動格子,能夠適應於任何目標的尺寸.
那麼這個算法的具體過程:
1. 首先使用Efficient Graph-Based Image Segmentation論文中的方法來按層次來快速獲得分割區域R
2. 初始化類似度集合S
3. 從分割區域集合R中來兩兩計算類似度,放入到類似度S集合中.
4. 從類似度S集合中,取出類似度最高的兩個分割區域.而後將這兩個區域進行合併,並放入到R中,而後從類似度S集合中去除掉
這兩個分割區域相關聯的區域.而後計算合併的新區域 和它鄰近區域的類似性,放入到S中,這樣循環.直到S集合爲空集
5.重複3直到這個區域變爲一個.
而後輸出在這個過程當中的全部的變化的區域.
關於多樣性策略:
分爲兩個大部分: 顏色空間多樣性,區域類似度多樣性
1. 顏色空間多樣性包含八種: [1]. RGB,[2]. I灰度圖(grey), [3]. Lab,[4]. RGB圖像中歸一化的rg通道和圖像的灰度圖. [5].HSV
[6].歸一化的rbg,[7].C,[8].H
2. 區域類似度多樣性: 對紋理,吻合度,大小這幾個特徵進行計算
具體推倒過程,見論文.
那麼選擇性算法在物體識別中如何使用的呢?
咱們使用選擇性算法獲取到一系列可能有目標的區域L,而後咱們將咱們事先打好標籤的目標區域(咱們成爲的GT)做爲正樣本,在L集合中的區域中和GT的IOU在0.2~0.5之間的做爲這個類的負樣本,對於重合度及IOU超過0.7的負樣本,我將它丟掉,而後對這些區域的數據,進行特徵提取,論文中使用的SIFT算法,而後將這些特徵中一塊兒放入到線性SVM進行該類進行訓練.而後將得分很高的錯誤樣本,放入到負樣本中繼續訓練.依次往復.