目錄html
算力和數據是影響深度學習的兩個關鍵因素。在算力知足的狀況下,爲了達到更好的效果,咱們就須要提供海量優質素材數據給神經網絡,以求訓練出來高精度的網絡模型。在平時的測試過程當中,也發現基於深度學習的算法,素材的數量、素材的均衡度和標註的質量對訓練出來的模型精度影響很是大。
常見的算法模型訓練所須要的素材格式主要爲:算法
模型訓練的過程就是將上述素材輸入到神經網絡,通過反覆迭代優化,以求獲得效果最好的通用模型。在實際應用模型的時候,會根據檢測到目標對象輸出座標/大小、目標類型、置信度。用一種數據類型表示以下:網絡
(xmin,ymin,xmax,ymax,class,score)
可設置一個門限值,經過與score進行比較,過濾掉部分結果工具
經過對深度學習的基礎知識學習,咱們能夠理解深度學習就是經過輸入海量標註素材,不斷調整模型參數去擬合,最終輸出效果較好的模型,再經過輸入非素材中的數據來預測結果,以求達較高的預測準確率和通用性。如下爲目前經常使用的圖像素材標註工具labelImg,標註完成後會生成相應的xml文件,用以標識座標和類型,以下圖所示:學習
圖像標註時,須要人工標出目標的位置和大小,並給出或選擇目標類型。因此對人工標註是有必定要求的。常見的標註問題以下所示:測試
所以一個合格的標註應該具有如下因素:字體
標註框大小合適意味着所畫的標註矩形框恰好將目標對象包圍住,對象與標註框間的間隙合適,不能過大也不能過濾。過大會傳遞給網絡沒必要要的信息,過小傳遞給網絡的信息會存在缺失。優化
位置通常是標註框大小合適,但存在與目標對象存在偏移的狀況,以下所示:設計
在標註時,不能僅標註完整可見的目標對象,對於人眼可見能分辨的對象也要進行標註,爲提升模型通用性,不少遮擋目標也是須要能被模型檢測識別出來的。針對這種狀況須要根據具體業務規則進行處理,通常須要遵循的原則以下所示:視頻
雖然各個算法對小目標的檢測效果有所差別,但對於小目標的目標對象仍然須要進行標註。遵循的原則跟目標遮擋時的處理同樣,只要人眼能夠進行分辨,仍然須要進行標註。
不一樣的業務,對於目標的識別也是不同的,如對於Logo侵權這種問題,如國際一些公開通用的Logo則不須要進行標註,以下所示:
針對Logo侵權的目標對象,通常打印體字無須要進行標註,但對於藝術字或單獨設計的字體也是須要進行標註的。
這種狀況通常是被遮擋面積過大、距離太遠或圖像和視頻分辨率很低,致使人眼沒法進行分辨,針對這種狀況則無需進行標註。
這種狀況須要根據業務場景進行區分處理。在平時測試,我所遵循的原則以下所示:
這種狀況通常爲標註軟件Bug或人工標註出現越界,致使標註框看起來存在部分框缺失。以下所示:
從素材的三大關鍵要素(素材數量、素材的均衡度、標註質量)來看,咱們能夠採用如下方式來保證素材質量
在收集數據時,須要儘量多的從各個渠道多收集素材數據,如合法爬蟲、公開數據集等
素材的均衡度一般是指素材的多樣性分佈。如視頻裏面,因爲拍攝的角度不一樣,出來的素材角度也是不一樣,如前方、後方、左側、右側等。圖像也是取決於拍攝素材的擺放角度,例如拍攝一件衣服,如正前方,正後方、左側、右側,斜面拍攝,距離遠近等,只有在選擇的素材儘量的多樣,訓練出來的模型也纔有更好的通用性。
數據標註和檢查是很是重要的一個環節,須要注意如下幾個方面:
雖然對於數據的標註,有時間和進度要求,但要結合實際狀況找到平衡點,不要單純追求速度,致使標註質量降低,致使往後大量返工
指定專人按期對標註的素材進行審覈,能夠很大避免在標註過程出現的問題,如標註質量較差,每一個人對標註的理解存在差別等。