二年前,我寫了《類似圖片搜索的原理》,介紹了一種最簡單的實現方法。html
昨天,我在isnowfy的網站看到,還有其餘兩種方法也很簡單,這裏作一些筆記。算法
1、顏色分佈法網站
每張圖片均可以生成顏色分佈的直方圖(color histogram)。若是兩張圖片的直方圖很接近,就能夠認爲它們很類似。htm
任何一種顏色都是由紅綠藍三原色(RGB)構成的,因此上圖共有4張直方圖(三原色直方圖 + 最後合成的直方圖)。blog
若是每種原色均可以取256個值,那麼整個顏色空間共有1600萬種顏色(256的三次方)。針對這1600萬種顏色比較直方圖,計算量實在太大了,所以須要採用簡化方法。能夠將0~255分紅四個區:0~63爲第0區,64~127爲第1區,128~191爲第2區,192~255爲第3區。這意味着紅綠藍分別有4個區,總共能夠構成64種組合(4的3次方)。圖片
任何一種顏色必然屬於這64種組合中的一種,這樣就能夠統計每一種組合包含的像素數量。ip
上圖是某張圖片的顏色分佈表,將表中最後一欄提取出來,組成一個64維向量(7414, 230, 0, 0, 8, ..., 109, 0, 0, 3415, 53929)。這個向量就是這張圖片的特徵值或者叫"指紋"。ci
因而,尋找類似圖片就變成了找出與其最類似的向量。這能夠用皮爾遜相關係數或者餘弦類似度算出。get
2、內容特徵法it
除了顏色構成,還能夠從比較圖片內容的類似性入手。
首先,將原圖轉成一張較小的灰度圖片,假定爲50x50像素。而後,肯定一個閾值,將灰度圖片轉成黑白圖片。
若是兩張圖片很類似,它們的黑白輪廓應該是相近的。因而,問題就變成了,第一步如何肯定一個合理的閾值,正確呈現照片中的輪廓?
顯然,前景色與背景色反差越大,輪廓就越明顯。這意味着,若是咱們找到一個值,可使得前景色和背景色各自的"類內差別最小"(minimizing the intra-class variance),或者"類間差別最大"(maximizing the inter-class variance),那麼這個值就是理想的閾值。
1979年,日本學者大津展之證實了,"類內差別最小"與"類間差別最大"是同一件事,即對應同一個閾值。他提出一種簡單的算法,能夠求出這個閾值,這被稱爲"大津法"(Otsu's method)。下面就是他的計算方法。
假定一張圖片共有n個像素,其中灰度值小於閾值的像素爲 n1 個,大於等於閾值的像素爲 n2 個( n1 + n2 = n )。w1 和 w2 表示這兩種像素各自的比重。
w1 = n1 / n
w2 = n2 / n
再假定,全部灰度值小於閾值的像素的平均值和方差分別爲 μ1 和 σ1,全部灰度值大於等於閾值的像素的平均值和方差分別爲 μ2 和 σ2。因而,能夠獲得
類內差別 = w1(σ1的平方) + w2(σ2的平方)
類間差別 = w1w2(μ1-μ2)^2
能夠證實,這兩個式子是等價的:獲得"類內差別"的最小值,等同於獲得"類間差別"的最大值。不過,從計算難度看,後者的計算要容易一些。
下一步用"窮舉法",將閾值從灰度的最低值到最高值,依次取一遍,分別代入上面的算式。使得"類內差別最小"或"類間差別最大"的那個值,就是最終的閾值。具體的實例和Java算法,請看這裏。
有了50x50像素的黑白縮略圖,就等於有了一個50x50的0-1矩陣。矩陣的每一個值對應原圖的一個像素,0表示黑色,1表示白色。這個矩陣就是一張圖片的特徵矩陣。
兩個特徵矩陣的不一樣之處越少,就表明兩張圖片越類似。這能夠用"異或運算"實現(即兩個值之中只有一個爲1,則運算結果爲1,不然運算結果爲0)。對不一樣圖片的特徵矩陣進行"異或運算",結果中的1越少,就是越類似的圖片。