EasyDL經常使用概念

目錄前端

  1. 模型與模型類型
  2. 模型訓練相關
  3. 模型效果相關
  4. 模型部署相關
  5. 數據相關

模型與模型類型

EasyDL支持7類模型訓練,包括圖像分類、物體檢測、圖像分割、聲音分類、文本分類、短文本匹配(僅專業版支持)、視頻分類。算法

圖像分類

可識別一張圖中是不是某類物體/狀態/場景,適用於圖片中主體或者狀態單一的場景. image.png服務器

物體檢測

可識別圖中每一個物體的位置、名稱,適合有多個主體、或要識別位置及數量的場景 image.png網絡

圖像分割

對比物體檢測,可識別圖中每一個物體的名稱、位置(像素級輪廓)並計數,適合圖中有多個主體、須要識別主體位置或輪廓的場景 image.png學習

聲音分類

可識別音頻中是什麼類型的聲音,多應用於生產或泛安防場景中監控異常聲音等 image.png大數據

文本分類

可判斷一段文本是否屬於某一個自定義的類別,適用於文本篩選、文本歸類、文本聚合等多種應用場景 image.png優化

短文本匹配

可支持定製模型判斷兩段短文本的類似度,如在客服問答場景中,支持用戶經過訓練短文本匹配的模型,可以快速識別出知識庫中與用戶問題類似的相關問題,並推薦出相應的答案,快速提高客服問答效率。spa

視頻分類

定製視頻分類模型,能夠分析視頻的內容,識別出視頻內人體作的是什麼動做,物體/環境發生了什麼變化 image.png操作系統

模型訓練相關

AutoDL Transfer

AutoDL Transfer模型是百度研發的AutoDL技術之一,結合了模型網絡結構搜索、遷移學習技術、並針對用戶數據進行自動優化。與通用算法相比,訓練時間較長,但更適用於細分類場景。例如,通用算法可用於區分貓和狗,但若是要區分不一樣品種的貓,則AutoDL效果會更好.net

ERNIE

預訓練模型ERNIE(艾尼)是百度基於用戶大數據訓練的擁有當前業內最好效果的中文語義表示模型。ERNIE(艾尼)預訓練模型,已累計學習10億多知識,可以助力各NLP任務快速提高效果。平臺內置了最新的ERNIE2.0,並提供了ERNIE2.0-Base、ERNIE2.0-Large兩個版本供用戶選擇。

模型效果相關

準確率

圖像分類/文本分類/聲音分類等分類模型的衡量指標,正確分類的樣本數與總樣本數之比,越接近1模型效果越好

F1-score

對某類別而言爲精確率和召回率的調和平均數,對圖像分類/文本分類/聲音分類等分類模型來講,該指標越高效果越好

精確率(Precision)

對某類別而言爲正確預測爲該類別的樣本數與預測爲該類別的總樣本數之比

召回率(Recall)

對某類別而言爲正確預測爲該類別的樣本數與該類別的總樣本數之比

top一、top2…top5

在查看圖像分類/文本分類/聲音分類/視頻分類模型評估報告中,top1-top5指的是針對一個數據進行識別時,模型會給出多個結果,top1爲置信度最高的結果、top2次之…正常業務場景中,咱們一般會採信置信度最高的識別結果,重點關注top1的結果便可。

mAP

mAP(mean average precision)是物體檢測(Object Detection)算法中衡量算法效果的指標。對於物體檢測任務,每一類object均可以計算出其精確率(Precision)和召回率(Recall),在不一樣閾值下屢次計算/試驗,每一個類均可以獲得一條P-R曲線,曲線下的面積就是average

閾值

物體檢測模型會存在一個可調節的閾值(threshold),是正確結果的斷定標準,例如閾值是0.6,置信度大於0.6的識別結果會被看成正確結果返回。每一個物體檢測模型訓練完畢後,能夠在模型評估報告中查看推薦閾值,在推薦閾值下F1-score的值最高。

模型部署相關

公有云API

模型部署爲Restful API,能夠經過HTTP請求的方式進行調用。

設備端SDK

模型部署爲設備端SDK,可集成在前端智能計算硬件設備中,可徹底在無網環境下工做,全部數據皆在設備本地運行處理。目前支持IOS、ANDROID、WINDOWS、LINUX四種操做系統及多款主流智能計算硬件。

本地服務器部署

模型部署爲本地服務器部署,可得到基於定製EasyDL模型封裝而成的本地化部署的方案,此軟件包部署包開發者本地的服務器上運行可以獲得與在線API功能徹底相同的接口。

軟硬一體方案

目前EasyDL支持兩款軟硬一體硬件,包括EasyDL-EdgeBoard軟硬一體方案及EasyDL-十目計算卡。經過在AI市場購買,可得到硬件+專項適配硬件的設備端SDK,支持在硬件中離線計算。

數據相關

智能標註

智能標註爲一套人機交互的協做標註方式,目前EasyDL物體檢測訓練任務支持智能標註,在手工標註少許數據後,系統會從數據集全部圖片中篩選出最關鍵的圖片並提示須要優先標註。一般狀況下,只需標註數據集30%左右的數據便可訓練模型。與標註全部數據後訓練相比,模型效果幾乎等同。

>> 訪問 PaddlePaddle 官網,瞭解更多相關內容    

相關文章
相關標籤/搜索