AI-數據標註類型

時間 2019-11-08

標籤數據標註類型简体版

原文原文鏈接

隨着數據的暴增和計算機硬件技術的發展，也催生了AI技術在各行各業的應用滲透。而想將AI技術應用到各行各業，數據是必需品。由於數據直接影響到AI最終訓練出來的模型好壞。AI建模沒有太大門檻，但數據纔是真正的門檻。所以，目前業界流傳着一段話有多少人工智能，就有多少人工。前一篇講述了數據如何標註及其注意，今天來學習一下數據標註的類型有哪些？git

誰來作數據標註

目前各個公司須要標註的數據，通常同下面幾大公司或人員承擔github

公司本身招聘人員或實習生進行標註算法

這種方式最大的優點是：能夠隨時檢查標註的質量和進度，便於快速溝通和調整，數據能夠作到保密不外泄;劣勢是成本較高工具
外包給數據標註公司學習

這種方式最大的優點是：速度很是快，成本低廉，標註公司也具有必定的開發標註工具能力，可定製性化能力較強;但劣勢也明顯標註公司魚龍混雜，良莠不齊，須要隨時檢查標註質量，返工成本較大。另外數據也沒法作到保密不外泄人工智能
外包給私人團體3d

這種方式的優劣勢基本同標註公司。優點是成本較低，由於能夠大量招收人員，如農村閒置人員，兼職人員等。稍微培訓下便可投入標註。視頻

誰來管理數據標註

針對數據分配給不一樣的人員，相應的角色也能夠分爲三種類型：對象

數據標註人員blog

主要負責數據的標註和彙總
數據檢查人員

主要負責數據標註的質量檢查，常採用抽檢方式檢查，可細分爲部分抽檢（比例約20%~30%）或所有抽檢
數據管理人員

負責人員任務分配、進度跟進、標註培訓及對外/對內協調溝通等

數據標註類型

因AI技術應用到具體的實例場景，會有很大差別，所以標註的類型也有不少，詳細以下所示：

圖像標註-2D邊框標註

這種類型應該是最多見的標註方式，經常使用於檢測目標對象的相應區域，標註框位於目標對象的四周，以下圖所示：

圖像標註-3D邊框標註

也稱立方體標註，相比2D標註而言，還能夠展示目標對象的近似深度。以下所示：

圖像標註-語義分割

根據檢測區域的不一樣，將圖像標註爲不一樣的像素，以下所示：

圖像標註-多邊形標註

根據需求標註目標對象的形狀，經常使用於沒法使用邊框標註的不規則的目標對象，須要在目標對象的各個關鍵點進行描點，不管最終爲什麼形狀，均要能反應目標對象的輪廓形狀和全部邊緣，以下所示：

圖像標註-直線或曲線標註

根據需求標註目標對象對應的線條位置，線條多是直線也多是曲線，經常使用於分隔代表邊界的事物。經常使用於自動駕駛，以下所示：

圖像標註-點標註

這種標註通常用於人臉識別，人體姿態跟蹤（如POSE算法）等

視頻標註-跟蹤標註

在視頻或連續的圖像中跟蹤標註的目標對象，造成與ID關聯的運動軌跡

文本標註-中英文語音轉寫與校對

英文語音轉中文文本或中文文本轉英文語音。

語音標註-客服語音標註

外呼機器人進行外呼記錄語音標註呼叫成功或失敗，從而訓練話術。

經常使用標註工具

經常使用標註工具以下所示：

labelImg

下載地址：https://github.com/tzutalin/labelImg
注意事項：使用labelImg時，路徑不能包含中文
精靈標註助手

下載地址：http://www.jinglingbiaozhu.com/

相關文章

相關標籤/搜索

WXS數據類型

數據類型與類型檢測

高級數據類型

數據類型，運算符

高級數據類型2

變量_數據類型

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<