顏色聚類方法綜述

  畢業了,畢業論文也能夠拿來曬曬了。覺的本身的論文涉及的知識點特別多,用到了不少圖像處理和機器學習方面的技術。第三章主要是講的顏色聚類的方法用來提取天然場景文本的候選連通域。(工做了時間不是不少,先把文章發上來,一週以內在好好拓展並整理).算法

1、顏色聚類的優勢

  分析天然場景文本的特色可得,在一個文本區域內部,通常一個字符內部的顏色變化不大。對於一幅24位RGB彩色圖,須要處理的顏色範圍達到 。顯然,大範圍、高精度的顏色對於文本定位來講是沒有必要的,因此本章先用顏色聚類的方式來縮小顏色空間的範圍,增大各個顏色間的距離,以便於後續連通域提取。機器學習

  如圖3. 2所示圖(a)是原圖,圖(b)是對應的RGB顏色空間三維散點圖,圖(c)是聚類後的圖像,圖(d)是圖(c)對應的散點圖,圖(a)中文本和背景的顏色混成一團難以分割,而圖(d)中能夠明顯看到兩部分不一樣的顏色團的間隙,而這兩部分顏色分別對應的是文本和背景。目前顏色聚類的方法有不少,不一樣的方法適用於解決不一樣的問題。下面首先分析對比了目前主流的方法,而後從效果、時間、參數設定等各個方面考慮,選取適用於文本定位的方法。 (a) 原圖 (b) 圖(a)的顏色散佈圖 (c) 圖(a)聚類後的圖 (d) 圖(c)的顏色散佈圖 圖3. 2聚類增大顏色距離示意圖。函數

2、 顏色聚類方法

  聚類是對數據的一種彙集,是將相似的數據聚成一類。聚類是一種無監督的分類方式,其優勢在於不須要預先的訓練過程。目前比較經常使用的聚類方式有K-means,混合高斯模型 (Gaussian Mixture Models,GMM),Mean shift等。學習

1. K-means算法

  K-means是比較簡單又經常使用的聚類算法,k表示的是聚類中心的個數,每一個類是由相應的聚類中心來表示。K-means算法包括四個步驟:ui

  (1) 隨機選擇初始的聚類中心。spa

  (2) 把每一個目標分配給最近的中心(最近的度量指的是目標到中心的歐式距離)。3d

  (3) 根據上一步聚好的類,從新計算聚類中心(全部點到上一步中心的平均值)。blog

  (4) 重複(2)直到聚類中心再也不發生變化。 K-means 的優勢是簡單快速而且可以很容易的實現,其缺點是K值須要人工設定,另外對於離羣點太過敏感。繼承

2. GMM算法

  GMM用於聚類是基於這樣的假設即數據空間的數據是由多個高斯模型生成的。GMM解決的問題是根據數據空間的數據來估計多個高斯模型的參數,而後根據這些參數肯定高斯模型[33]。一旦高斯模型肯定了,那麼數據的聚類中心也就肯定了。get

假設數據空間中的數據符合高斯混合模型即:

                      Eqn016(3.1)

其中 Eqn017是聚類中心的個數, Eqn018表明的是高斯模型之間的權值而且符合Eqn019 。其中 Eqn020符合下式:

                      Eqn021(3.2)

其中 Eqn022Eqn023分別表明的是第 Eqn024個聚類中心的均值和方差。那麼須要根據數據來估計GMM的參數爲Eqn025 。估計GMM的參數的算法爲EM算法。EM算法分爲兩步,在E步假設參數Eqn026 是已知的,根據最大似然來估計每一個高斯模型的權值。在M步對E步獲得的結果從新估計參數,而後不斷迭代地使用EM步驟,直到收斂。

GMM用於聚類的優勢是最後獲得的結果是數據屬於某個類的機率,其缺點是要先肯定聚類中心的個數。

3. Mean shift算法

  Mean shift的目標是根據給定的數據尋找機率密度的局部最大值。Mean-shift主要包括四個步驟:

  (1) 隨機選擇若干個感興趣區域。

  (2) 計算感興趣區域數據的中心 。

  (3) 移動區域到新的中心。

  (4) 不斷計算直到收斂。

  Mean shift的數學定義以下:

                       Eqn028(3.3)

其中, Eqn029爲核函數加權下的Mean shift表明的是均值向量移動的方向, Eqn030是感興趣區域的中心, Eqn031表示的是核函數, Eqn032表示的是帶寬。在算法中,首先肯定Mean shift的起點爲感興趣區域的中心 Eqn033,而後計算Mean shift 向量的終點式3.3中的第一項。而後將感興趣區域的中心移動到向量的終點,從新計算Mean shift,當式(3.4)知足時,結束移動,這時中心就收斂到數據空間中局部最大值。

                         Eqn034(3.4)

     Mean shift的思想是將數據點分配給隱含機率密度函數的某個模型。它的優勢是聚類的類別數不須要預先知道而且聚類的結構能夠是任意的,它的缺點是計算複雜度過高。

4. Quick shift算法

  Quick shift是由Mean shift改進而來的。Quick shift改進了計算複雜度過高這一缺點,它不須要使用梯度來尋找機率密度的模式,而僅僅是將每一個點移動到使機率密度增長的最近的點來得到。公式以下:

                     Eqn035(3.5)

其中 Eqn036表明的是特徵空間中點的下一個位置, Eqn037表明的是兩點之間的距離, Eqn038是核函數,通常選擇高斯核函數,Eqn039 是特徵空間中點的個數。經過不斷移動,全部點連成了一顆樹,再經過必定的閾值將樹分割成一個森林,這樣森林裏的每棵樹就是一個聚類。特徵空間是一個五維空間,包含轉換到Lab空間的三個顏色份量和兩個空間位置信息。

  Quick shift繼承了Mean shift的優勢,不須要指定聚類中心,但同時改進了其速度慢的缺點。

相關文章
相關標籤/搜索