OpenCV2:Mat屬性type，depth，step

時間 2020-02-28

標籤 opencv2 opencv mat 屬性 type depth step 简体版

原文原文鏈接

在OpenCV2中Mat類無疑使佔據着核心地位的，前段時間初學OpenCV2時對Mat類有了個初步的瞭解，見OpenCV2:Mat初學。這幾天試着用OpenCV2實現了圖像縮小的兩種算法：基於等間隔採樣和基於局部均值的圖像縮小，發現對Mat中的數據佈局和一些屬性的認知仍是懵懵懂懂，本文對Mat的一些重要屬性和數據佈局作一個總結。html

Mat的做用

The class Mat represents an n-dimensional dense numerical single-channel or multi-channel array. It can be used to store real or complex-valued vectors and matrices, grayscale or color images, voxel volumes, vector fields, point clouds, tensors, histograms (though, very high-dimensional histograms may be better stored in a SparseMat ).算法

上面的一段話引用自官方的文檔，Mat類用於表示一個多維的單通道或者多通道的稠密數組。可以用來保存實數或複數的向量、矩陣，灰度或彩色圖像，立體元素，點雲，張量以及直方圖（高維的直方圖使用SparseMat保存比較好）。簡而言之，Mat就是用來保存多維的矩陣的。數組

Mat的常見屬性

data uchar型的指針。Mat類分爲了兩個部分:矩陣頭和指向矩陣數據部分的指針，data就是指向矩陣數據的指針。
dims 矩陣的維度，例如5*6矩陣是二維矩陣，則dims=2，三維矩陣dims=3.
rows 矩陣的行數
cols 矩陣的列數
size 矩陣的大小，size(cols,rows),若是矩陣的維數大於2，則是size(-1,-1)
channels 矩陣元素擁有的通道數，例如常見的彩色圖像，每個像素由RGB三部分組成，則channels = 3

下面的幾個屬性是和Mat中元素的數據類型相關的。函數

type
表示了矩陣中元素的類型以及矩陣的通道個數，它是一系列的預約義的常量，其命名規則爲CV_(位數）+（數據類型）+（通道數）。具體的有如下值：

CV_8UC1	CV_8UC2	CV_8UC3	CV_8UC4
CV_8SC1	CV_8SC2	CV_8SC3	CV_8SC4
CV_16UC1	CV_16UC2	CV_16UC3	CV_16UC4
CV_16SC1	CV_16SC2	CV_16SC3	CV_16SC4
CV_32SC1	CV_32SC2	CV_32SC3	CV_32SC4
CV_32FC1	CV_32FC2	CV_32FC3	CV_32FC4
CV_64FC1	CV_64FC2	CV_64FC3	CV_64FC4

這裏U（unsigned integer）表示的是無符號整數，S（signed integer）是有符號整數，F（float）是浮點數。
例如：CV_16UC2，表示的是元素類型是一個16位的無符號整數，通道爲2.
C1，C2，C3，C4則表示通道是1,2,3,4
type通常是在建立Mat對象時設定，若是要取得Mat的元素類型，則無需使用type，使用下面的depth

depth
矩陣中元素的一個通道的數據類型，這個值和type是相關的。例如 type爲 CV_16SC2，一個2通道的16位的有符號整數。那麼，depth則是CV_16S。depth也是一系列的預約義值，
將type的預約義值去掉通道信息就是depth值:
CV_8U CV_8S CV_16U CV_16S CV_32S CV_32F CV_64F
elemSize
矩陣一個元素佔用的字節數，例如：type是CV_16SC3，那麼elemSize = 3 * 16 / 8 = 6 bytes
elemSize1
矩陣元素一個通道佔用的字節數，例如：type是CV_16CS3，那麼elemSize1 = 16 / 8 = 2 bytes = elemSize / channels

下面是一個示例程序，具體說明Mat的各個屬性：佈局

Mat img(3, 4, CV_16UC4, Scalar_<uchar>(1, 2, 3, 4));
    
    cout << img << endl;

    cout << "dims:" << img.dims << endl;
    cout << "rows:" << img.rows << endl;
    cout << "cols:" << img.cols << endl;
    cout << "channels:" << img.channels() << endl;
    cout << "type:" << img.type() << endl;
    cout << "depth:" << img.depth() << endl;
    cout << "elemSize:" << img.elemSize() << endl;
    cout << "elemSize1:" << img.elemSize1() << endl;

首先建立了一個3*4的具備4個通道的矩陣，其元素類型是CV_16U。Scalar_是一個模板向量，用來初始化矩陣的每一個像素，由於矩陣具備4個通道，Scalar_有四個值。其運行結果：
運行結果首先打印了Mat中的矩陣，接着是Mat的各個屬性。注意其type = 26,而depth = 2。這是因爲上面所說的各類預約義類型
例如，CV_16UC4，CV_8U是一些預約義的常量。spa

step

Mat中的step是一個MStep的一個實例。其聲明以下：指針

struct CV_EXPORTS MStep
    {
        MStep();
        MStep(size_t s);
        const size_t& operator[](int i) const;
        size_t& operator[](int i);
        operator size_t() const;
        MStep& operator = (size_t s);

        size_t* p;
        size_t buf[2];
    protected:
        MStep& operator = (const MStep&);
    };

從其聲明中能夠看出，MStep和size_t有比較深的關係。用size_t做爲參數的構造函數和重載的賦值運算符code

MStep(size_t s);
MStep& operator = (size_t s);

向size_t的類型轉換以及重載的[ ]運算符返回size_thtm

const size_t& operator[](int i) const;
        
size_t& operator[](int i);

size_t的數組以及指針對象

size_t* p;
        
size_t buf[2];

那麼size_t又是什麼呢，看代碼

typedef  unsigned int   size_t;

size_t就是無符號整數。

再看一下MStep的構造函數，就能夠知道其究竟保存的是什麼了。

inline Mat::MStep::MStep(size_t s) { p = buf; p[0] = s; p[1] = 0; }

從MStep的定義能夠知道，buff是一個size_t[2]，而p是size_t *，也就是能夠把MStep看作一個size_t[2]。那麼step中保存的這個size_t[2]和Mat中的數據有何種關係呢。

step[0]是矩陣中一行元素的字節數。

step[1]是矩陣中一個元素的本身數，也就是和上面所說的elemSize相等。

上面說到，Mat中一個uchar* data指向矩陣數據的首地址，而如今又知道了每一行和每個元素的數據大小，就能夠快速的訪問Mat中的任意元素了。下面公式：

$addr(M_{i,j}) = M.data + M.step[0]*i + M.step[1]*j$

step1

規整化的step，值爲step / elemSize1。定義以下：

inline size_t Mat::step1(int i) const { return step.p[i]/elemSize1(); }

仍以上例代碼中定義的img爲例，來看下step,step1具體的值：
img（3*4）的type是CV_16UC4,step[0]是其一行所佔的數據字節數4 *4 * 16 / 8 = 32.
step[1] 是一個元素所佔的字節數，img的一個元素具備4個通道，故：4 * 16 / 8 = 2
step1 = step / elemSize1，elemSize1是元素的每一個通道所佔的字節數。

N維的step(N > 2)

上面分析step是一個size_t[2]，實際不是很正確，正確的來講step應該是size_t[dims]，dims是Mat的維度，因此對於上面的二維的Mat來講，step是size_t[2]也是正確的。
下面就對三維的Mat數據佈局以及step（維度大於3的就算了吧）。

上圖引用自http://ggicci.blog.163.com/blog/static/210364096201261052543349/ 蒐集資料時發現了這幅圖，一切就變的簡單了感謝做者 Ggicci

三維的數據在Mat中是按面來存儲的，上圖描述的很清晰，這裏再也不多說。
上面言道，step是一個size_t[dims]，dims是維度。so，三維的step就是size_t[3]。其他的很少說了，看圖就有了。下面來建立一個三維的Mat，實際看看

int dims[3] = { 3, 3, 3 };
    Mat src(3, dims, CV_16SC2, Scalar_<short>(1,2));

    cout << "step[0]:" << src.step[0] << endl;
    cout << "step[1]:" << src.step[1] << endl;
    cout << "step[2]:" << src.step[2] << endl;

首先建立一個3*3*3，depth爲CV_16S的兩通道的Mat
step[0]是一個數據面的大小 3 * 3 * (16 / 8 ) * 2 = 36
step[1]是一行數據的大小 3 * (16 / 8 ) * 2 = 12
step[2]是一個元素的大小 2 * (16 / 8) = 4

PS: 三維的Mat 不能使用 <<運算符進行輸出的。

over

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。