3月27日下午,第51期阿里雲產品發佈會-智能視覺產品隆重發布,本次產品發佈會首次面向全網用戶深刻的解讀了智能視覺的前世此生。html
隨着人工智能的技術不斷成熟,AI逐漸在各行業內落地。在新零售領域,咱們經過物體識別判斷貨品位置和數量;甚至在養豬場,用AI技術檢測養豬的位置及數量等等。然而除了一些很是成熟的基礎感知層AI能力如人臉識別、OCR等能夠直接應用,實際上絕大部分場景都須要用業務標註數據來進行單獨訓練的,因此定製化的需求愈來愈多。每一個定製化的模型,都是須要算法工程師經過大量的自身業務標註數據,通過不斷的演算、測試、訓練,來搭建深度神經網絡模型。而實際上傳統企業想要自建訓練模型又將面臨着專業人才十分稀缺、開發落地週期冗長等等困境。算法
如此一來,如何以最低的成本實現AI技術落地變成了行業急需解決的問題。網絡
近期,阿里雲發佈智能視覺產品,幫助零機器學習背景、零算法基礎的企業或者開發者們,實現高質量定製化模型訓練的快速落地,具有圖像分類、物體檢測、直播識別等AI能力,可有效應用於視頻監控、互聯網短視頻內容識別歸類、新零售物件統計、工業質檢等場景。架構
有了智能視覺,即便零算法基礎的開發者,均可以進行頁面化一鍵式訓練和預測。經過上傳少許業務數據,快速訓練定製化模型,最快10分鐘完成訓練和部署。機器學習
智能視覺總體的產品架構是:用戶經過對象存儲OSS導入或本地上傳圖片訓練集,對圖像及圖像內物體進行標籤管理,實現一鍵訓練(目前已經支持圖像分類和物體檢測),標註好以後一鍵生成迭代,生成業務定製專屬模型,並能夠經過迭代來不斷完善模型的準召率、精準度,最終以API的形式將模型訓練能力快速輸出應用於業務之中,同時支持對圖片、視頻、直播流、監控流等多種格式的預測。學習
市場上大部分AI的服務是基於圖片進行處理,在面對視頻的時候,一般把視頻按照固定的時間間隔採樣出來,批量截取畫面並進行結果匯聚。這樣對視頻的處理方式廣泛存在時效性差、穩定差、複雜性高、信息丟失等問題。測試
基於阿里雲視頻雲團隊多年音視頻編解碼、媒體處理相關技術經驗,智能視覺構建全新的面向視頻架構:把視頻做爲第一類對象(First-Class Object)來看待。把視頻解碼、時間域分析、智能匯聚、音頻處理等引入到系統裏面來,把視頻處理和AI計算有機結合,以面向視頻的方式,在視頻處理的同時完成AI計算,精簡的流程可以大幅度縮短處理時間,從時間維度提高分析效果,並能簡化業務架構,讓用戶聚焦在覈心業務的發展上。爲用戶提供高效穩定、簡單易用、功能豐富的視頻AI服務。阿里雲
在深度學習層面,在其餘條件相同的狀況下,數據越多訓練效果是越好的。這就產生了一個問題,更好的效果必定須要更多的數據,這須要花費大量的人力去標註。人工智能
智能視覺採用數據增廣策略,增長數據的多樣性,增強模型泛化能力,對圖像進行旋轉、斜切、仿射變換、對比度調整、色度變化、水平鏡像等變換,增長數據量,同時保持增廣數據的真實性,實現了少許數據狀況下效果加強10-15%的訓練效果,同時有效下降標註數據的人力和時間成本。spa
智能視覺運用遷移學習的技術,根據天然圖像中的基礎邊緣、色塊、紋理的規律來概括物體特徵,而且經過在淺層網絡中複用這些基礎特徵,來減小標註數據,能以更快的時間、更高的質量生成業務場景相關數據,大幅度減小數據需求,進一步減小計算量,達到縮短新模型訓練時間的效果。大概規模在100張的圖片,生成模型只須要10分鐘。
基於阿里雲視頻雲團隊多年豐富的視頻處理經驗,針對用戶訓練的模型給出專業的、全面的效果評估,同時用戶也能夠選擇本身上傳圖片、直播、監控等視頻流輸入進行校驗,若是以爲準確率不夠高的話,還能夠再次上傳數據進行再一次訓練,實現快速迭代。
有了智能視覺,就意味着本來須要衆多專業AI和算法工程師才能搭建好的AI模型,如今在控制檯上經過簡單的點擊和上傳圖片,甚至徹底不須要代碼,就能夠完成了,整個過程操做簡單,從數據、模型到接口,一站式服務,全界面化管理,能夠節省大量的人力成本和時間成本,實現快速落地。
在發佈會中,智能視覺的產品經理袁華良爲網友演示了從零開始搭建一個訓練模型的整個過程。
第一步,在阿里雲官網智能視覺產品詳情頁快速瞭解產品信息,申請開通,審批經過後登陸控制檯,按照指引完成開通。
第二步,首次登錄,點擊立刻建立模型。
第三步,添加模型,上傳圖片,在圖片中進行標註。爲了讓訓練的數據更接近真實效果,建議一個模型至少有2個分類,每一個分類的圖片很多於15張。上傳完成後,點擊一鍵訓練便可。
第四步,訓練結果返回後,能夠看控制檯中看到準確率、召回率、mAP等數據。當訓練結果評估或者校驗結果不理想的時候,能夠將新圖片加入訓練集,從新進行標註,進行再一次訓練與模型迭代。
目前控制檯支持本地導入數據,API接口也支持從OSS、直播流、監控流的數據導入,點擊查看具體的接入文檔詳情。
智能視覺可應用在視頻監控領域,根據監控畫面中的內容,判斷是否爲出現違規現象,如出現車輛,打鬥等;同時能夠應用在互聯網短視頻領域,基於圖像對內容識別歸類,進行精準推送,提高用戶的點擊率和觀看體驗;在新零售領域,智能視覺能夠檢測實體店貨架中的貨品擺放位置及數量統計,減小巡檢工做量。同時,在工業質檢、農業養殖、醫療診斷等場景也能夠有很好的應用。
目前智能視覺在阿里雲官網開放公測,用戶能夠在線提交信息,進行免費試用的申請。咱們歡迎各產業的夥伴們與阿里雲共建視頻領域的AI應用。
阿里雲視頻雲團隊具備多年音視頻編解碼、媒體處理經驗,基於人工智能、深度學習技術,經過視頻多模態內容理解、結構化分析處理,推出視頻審覈、視頻DNA、視頻智能生產、智能視覺等能力,而且與點播、直播、短視頻、CDN內容分發、邊緣計算組合造成一站式智能視頻服務。
原文連接 本文爲雲棲社區原創內容,未經容許不得轉載。