圖像模式識別 (二)

時間 2019-11-17

標籤圖像模式識別简体版

原文原文鏈接

圖像識別數組

圖像識別的四個主要步驟：數據結構

圖像預處理 spa

圖象分割設計

圖像特徵提取索引

圖象分類圖片

圖像輸入內存

圖像處理 ci

圖像識別 it

像元圖像圖像處理

圖像預處理

濾去幹擾，噪聲等。如圖像信息微弱，還要進行加強處理，幾何調整，着色校訂等。

圖象分割

從圖像中定位，分離出不一樣的待識別物體。這一過程輸入的是整幅圖像，輸出是像元圖像。

圖像特徵抽取

提到須要特徵並對某些參數進行計算，測量，根據結果進行分類。

圖像分類

根據撮特徵值，利用模式識別方法進行分類，肯定相關信息。

3、圖像數據結構與圖像文件格式：

在計算機中，按照顏色和灰度的多少能夠將圖像爭爲二值圖像、灰度圖像、索引圖像和真彩色RGB圖像四種基本類型。目前，大多數圖像處理軟件都支持這四種類型的圖像。

(1) 二值圖像：

一幅二值圖像的二維矩陣僅由0、1兩個值構成，「0」表明黑色，「1」代白色。因爲每一像素（矩陣中每一元素）取值僅有0、1兩種可能，因此計算機中二值圖像的數據類型一般爲1個二進制位。二值圖像一般用於文字、線條圖的掃描識別（OCR）和掩膜圖像的存儲。

(2) 灰度圖像：

灰度圖像矩陣元素的取值範圍一般爲[0，255]。所以其數據類型通常爲8位無符號整數的（int8），這就是人們常常提到的256灰度圖像。「0」表示純黑色，「255」表示純白色，中間的數字從小到大表示由黑到白的過渡色。在某些軟件中，灰度圖像也能夠用雙精度數據類型（double）表示，像素的值域爲[0，1]，0表明黑色，1表明白色，0到1之間的小數表示不一樣的灰度等級。二值圖像能夠當作是灰度圖像的一個特例。

(3) 索引圖像：

索引圖像的文件結構比較複雜，除了存放圖像的二維矩陣外，還包括一個稱之爲顏色索引矩陣MAP的二維數組。MAP的大小由存放圖像的矩陣元素值域決定，如矩陣元素值域爲[0，255]，則MAP矩陣的大小爲256ⅹ3，用MAP=[RGB]表示。MAP中每一行的三個元素分別指定該行對應顏色的紅、綠、藍單色值，MAP中每一行對應圖像矩陣像素的一個灰度值，如某一像素的灰度值爲64，則該像素就與MAP中的第64行創建了映射關係，該像素在屏幕上的實際顏色由第64行的[RGB]組合決定。也就是說，圖像在屏幕上顯示時，每一像素的顏色由存放在矩陣中該像素的灰度值做爲索引經過檢索顏色索引矩陣MAP獲得。索引圖像的數據類型通常爲8位無符號整形（int8），相應索引矩陣MAP的大小爲256ⅹ3，所以通常索引圖像只能同時顯示256種顏色，但經過改變索引矩陣，顏色的類型能夠調整。索引圖像的數據類型也可採用雙精度浮點型（double）。索引圖像通常用於存放色彩要求比較簡單的圖像，如Windows中色彩構成比較簡單的壁紙多采用索引圖像存放，若是圖像的色彩比較複雜，就要用到RGB真彩色圖像。

(4) RGB彩色圖像：

RGB圖像與索引圖像同樣均可以用來表示彩色圖像。與索引圖像同樣，它分別用紅（R）、綠（G）、藍（B）三原色的組合來表示每一個像素的顏色。但與索引圖像不一樣的是，RGB圖像每個像素的顏色值（由RGB三原色表示）直接存放在圖像矩陣中，因爲每一像素的顏色需由R、G、B三個份量來表示，M、N分別表示圖像的行列數，三個M x N的二維矩陣分別表示各個像素的R、G、B三個顏色份量。RGB圖像的數據類型通常爲8位無符號整形，一般用於表示和存放真彩色圖像，固然也能夠存放灰度圖像。

數字化圖像數據有兩種存儲方式[6]：位圖存儲(Bitmap)和矢量存儲(Vector)
咱們日常是以圖像分辨率（即象素點）和顏色數來描述數字圖象的。例如一張分辨率爲640*480,16位色的數字圖片，就由2^16=65536種顏色的307200(=640*480)個素點組成。

　　位圖圖像：位圖方式是將圖像的每個象素點轉換爲一個數據，當圖像是單色（只有黑白二色）時，8個象素點的數據就佔據一個字節（一個字節就是8個二進制數，1個二進制數存放象素點）；16色的圖像每兩個象素點用一個字節存儲；256色圖像每個象素點用一個字節存儲。這樣就可以精確地描述各類不一樣顏色模式的圖像圖面。位圖圖像彌補了矢量式圖像的缺陷，它可以製做出色彩和色調變化豐富的圖像，能夠逼真地表現天然界的景象，同時也能夠很容易地在不一樣軟件之間交換文件，這就是位圖圖像的優勢；而其缺點則是它沒法制做真正的3D圖像，而且圖像縮放和旋轉時會產生失真的現象，同時文件較大，對內存和硬盤空間容量的需求也較高。位圖方式就是將圖像的每一像素點轉換爲一個數據。若是用1位數據來記錄，那麼它只能表明2種顏色（21=2）；若是以8位來記錄，即可以表現出256種顏色或色調(28=256)，所以使用的位元素越多所能表現的色彩也越多。一般咱們使用的顏色有16色、256色、加強16位和真彩色24位。通常所說的真彩色是指24位(28×28×28)的位圖存儲模式適合於內容複雜的圖像和真實照片。但隨着分辨率以及顏色數的提升，圖像所佔用的磁盤空間也就至關大；另外因爲在放大圖像的過程當中，其圖像勢必要變得模糊而失真，放大後的圖像像素點實際上變成了像素「方格」。用數碼相機和掃描儀獲取的圖像都屬於位圖。

矢量圖像：矢量圖像存儲的是圖像信息的輪廓部分，而不是圖像的每個象素點。例如，一個圓形圖案只要存儲圓心的座標位置和半徑長度，以及圓的邊線和半徑長度，以及圓的邊線和內部的顏色便可。該存儲方式的缺點是常常耗費大量的時間作一些複雜的分析演算工做，圖像的顯示速度較慢；但圖像縮放不會失真；圖像的存儲空間也要小得多。因此，矢量圖比較適合存儲各類圖表和工程設計圖。