霍夫變換是圖像處理中從圖像中識別幾何形狀的基本方法之一,應用很普遍,也有不少改進算法。最基本的霍夫變換是從黑白圖像中檢測直線(線段)。html
咱們先看這樣一個問題: 算法
設已知一黑白圖像上畫了一條直線,要求出這條直線所在的位置。優化
咱們知道,直線的方程能夠用y=k*x+b 來表示,其中k和b是參數,分別是斜率和截距。過某一點(x0,y0)的全部直線的參數都會知足方程y0=kx0+b。即點(x0,y0)肯定了一族直線。方程y0=kx0+b在參數k--b平面上是一條直線,(你也能夠是方程b=-x0*k+y0對應的直線)。這樣,圖像x--y平面上的一個前景像素點就對應到參數平面上的一條直線。咱們舉個例子說明解決前面那個問題的原理。設圖像上的直線是y=x, 咱們先取上面的三個點:A(0,0), B(1,1), C(22)。能夠求出,過A點的直線的參數要知足方程b=0, 過B點的直線的參數要知足方程1=k+b, 過C點的直線的參數要知足方程2=2k+b, 這三個方程就對應着參數平面上的三條直線,而這三條直線會相交於一點(k=1,b=0)。orm
同理,原圖像上直線y=x上的其它點(如(3,3),(4,4)等) 對應參數平面上的直線也會經過點(k=1,b=0)。這個性質就爲咱們解決問題提供了方法:htm
上面就是霍夫變換的基本思想。就是把圖像平面上的點對應到參數平面上的線,最後經過統計特性來解決問題。假如圖像平面上有兩條直線,那麼最終在參數平面上就會看到兩個峯值點,依此類推。ip
在實際應用中,y=k*x+b形式的直線方程沒有辦法表示x=c形式的直線(這時候,直線的斜率爲無窮大)。因此實際應用中,是採用參數方程p=x*cos(theta)+y*sin(theta)。這樣,圖像平面上的一個點就對應到參數p---theta平面上的一條曲線上。其它的仍是同樣。內存
再看下面一個問題: 文檔
咱們要從一副圖像中檢測出半徑以知的圓形來。這個問題比前一個還要直觀。咱們能夠取和圖像平面同樣的參數平面,以圖像上每個前景點爲圓心,以已知的半徑在參數平面上畫圓,並把結果進行累加。最後找出參數平面上的峯值點,這個位置就對應了圖像上的圓心。在這個問題裏,圖像平面上的每一點對應到參數平面上的一個圓。 get
把上面的問題改一下,假如咱們不知道半徑的值,而要找出圖像上的圓來。這樣,一個辦法是把參數平面擴大稱爲三維空間。就是說,參數空間變爲x--y--R三維,對應圓的圓心和半徑。圖像平面上的每一點就對應於參數空間中每一個半徑下的一個圓,這其實是一個圓錐。最後固然仍是找參數空間中的峯值點。不過,這個方法顯然須要大量的內存,運行速度也會是很大問題。數學
有什麼更好的方法麼?
咱們前面假定的圖像都是黑白圖像(2值圖像),實際上這些2值圖像可能是彩色或灰度圖像經過邊緣提取來的。咱們前面提到過,圖像邊緣除了位置信息,還有方向信息也很重要,這裏就用上了。根據圓的性質,圓的半徑必定在垂直於圓的切線的直線上,也就是說,在圓上任意一點的法線上。這樣,解決上面的問題,咱們仍採用2維的參數空間,對於圖像上的每一前景點,加上它的方向信息,均可以肯定出一條直線,圓的圓心就在這條直線上。這樣一來,問題就會簡單了許多。
接下來還有許多相似的問題,如檢測出橢圓,正方形,長方形,圓弧等等。這些方法大都相似,關鍵就是須要熟悉這些幾何形狀的數學性質。霍夫變換的應用是很普遍的,好比咱們要作一個支票識別的任務,假設支票上確定有一個紅顏色的方形印章,咱們能夠經過霍夫變換來對這個印章進行快速定位,在配合其它手段進行其它處理。霍夫變換因爲不受圖像旋轉的影響,因此很容易的能夠用來進行定位。
霍夫變換有許多改進方法,一個比較重要的概念是廣義霍夫變換,它是針對全部曲線的,用處也很大。就是針對直線的霍夫變換也有不少改進算法,好比前面的方法咱們沒有考慮圖像上的這一直線上的點是否連續的問題,這些都要隨着應用的不一樣而有優化的方法。
推薦雜誌
‘IEEE Transactions on Pattern And Machine Intelligence’
‘IEEE Transactions on Image Processing’
是最重要的兩本,其它的如ICIP等的會議文章也很是好。不過,要不想很偏理論,這些玩藝兒也沒什麼要看的。
源文檔 :<http://www.chinaai.org/ip/image-transform/hough-transform.html>