全景語義分割主流數據導出格式:JSON+Mask丨曼孚科技

圖像全景語義分割是人工智能計算機視覺領域的一個重要分支,它結合了圖像分類、目標檢測與圖像分割等技術,是針對圖像數據所進行的一種像素級分類。算法

通過全景語義分割處理後的圖像,普遍應用於自動駕駛、無人機等場景下的機器學習,是圖像處理領域最多見的一種數據標註類型。編程

這是一張通過全景語義分割處理後的2D圖像:json

圖1:自動駕駛圖像全景語義分割機器學習

值得注意的是,圖1只是通過語義分割處理後的「視覺直觀圖像」,並不能直接用於機器學習。在此張圖像基礎上導出的「JSON」格式以及「Mask」格式數據,才能被機器識別與應用。編程語言

一.JSON格式數據學習

JSON,英文全稱爲JavaScript Object Notation,是一種輕量級的數據交換格式,採用徹底獨立於編程語言的文本格式來存儲和表示數據。網站

JSON格式,最先在2001年由Douglas Crockford提出,目的是取代繁瑣笨重的XML格式。相較於XML格式,JSON格式有兩個顯著的優勢:書寫簡單,一目瞭然;符合JavaScript原生語法,能夠由解釋引擎直接處理,不用另外添加代碼。人工智能

這些優勢讓JSON格式迅速被接受,目前已經成爲各大網站交換數據的標準格式,並被寫入ECMAScript 5,成爲標準的一部分。spa

在人工智能領域,因爲JSON格式數據具備良好的可讀和便於快速編寫的特性,並可在不一樣平臺之間進行數據交換,同時也具有相似於C語言的習慣(包括C, C++, C#, Java, JavaScript, Perl, Python等),使其成爲標註數據集較爲理想的數據導出格式。翻譯

以圖1爲例,通過SEED數據服務平臺全景語義分割處理後,導出的JSON格式數據爲:

JSON格式文件(截取部份內容)

相較於圖像類數據,JSON數據以字符描述出圖像中的相關信息,包含的內容包括更新時間、項目名稱、數據集名稱、顏色信息、點座標信息、完成時間、標籤名稱等,將圖像信息化,有效提取圖像數據中的關鍵信息,完美契合機器學習的需求。

二.Mask圖像格式數據

Mask,中文翻譯爲掩膜,概念起源於半導體制造業。

在半導體制造中,許多芯片工藝步驟採用光刻技術,用於這些步驟的圖形「底片」稱爲掩膜(也稱做「掩模」),其做用是:在硅片上選定的區域中對一個不透明的圖形模板遮蓋,繼而下面的腐蝕或擴散將隻影響選定的區域之外的區域。

在圖像處理領域,Mask表示用選定的圖像、圖形或物體,對處理的圖像(所有或局部)進行遮擋,來控制圖像處理的區域或處理過程。

在數據標註領域,Mask圖像能夠用類似性變量或圖像匹配方法檢測和提取圖像中與掩膜類似的結構特徵,方便機器識別與學習。

一樣以圖1爲例,通過SEED數據服務平臺全景語義分割處理後,導出的Mask圖像爲:

Mask圖像

相較於圖1,Mask圖像用色塊覆蓋原有標註對象,同一色塊表示相同屬性內容。Mask圖像類數據集普遍應用於圖像識別、目標分類等領域。

三.SEED平臺數據導出格式

在一個完整的數據生命週期內,數據標註只佔整體流程中的一部分,通過標註的數據只有通過導出處理,才能用於相關算法識別與學習。

目前,SEED數據服務平臺全面支持各種型數據格式的導出,支持包括.json、.xml、.csv、.xls以及Mask等多種數據導出格式,知足不一樣類型算法模型的差別化需求。

同時,SEED數據服務平臺還支持全景語義分割模式下的JSON+Mask雙向數據導出,同一份數據只需標註一次,便可輸出兩種不一樣格式的結構化數據:

雙向數據導出功能下,JSON+Mask無需轉換,更無需重複導出,既可知足不一樣場景下的算法需求,同時也可避免重複勞動,提高生產效率。

相關文章
相關標籤/搜索