編者按:近日,Gartner最新發布了一份《Five Key Essentials for the New Generation of Intelligent Video Cloud》白皮書報告,報告中針對各行業在視頻應用領域升級過程當中面臨的技術痛點及挑戰,提出了構建新一代視頻雲的5個關鍵要素和相關參考標準,並描述了智能視頻雲如何以更便捷的服務和更低的成本幫助客戶加速升級。本文則對Gartner白皮書報告進行了詳細編譯。
如下爲譯文:
html
過去十年裏,中國移動互聯網的高速發展,帶動了各個產業IT基礎架構的擴展和升級:
• 2017年,大陸地區用戶平均帶寬達到52M,已經追平甚至超越了許多發達國家水平;
• 移動互聯網終端數超過14億臺,其中超過60%的設備接入了4G網絡;
• 5G時代也即將到來,視頻的內容和展示形式將更加多元化,在直播、點播等基礎場景上,又增長了短視頻和實時音視頻互動的新浪潮,同時視頻技術也在安防、醫療、教育、司法、廣電等領域有着全新的應用。
本文介紹各行業在視頻應用領域的升級過程當中,主要面臨的技術痛點和挑戰,並提出了構建新一代視頻雲的5個關鍵要素和相關參考標準,描述了智能視頻雲如何以更便捷的服務和更低的成本幫助客戶加速升級。將來視頻的應用的場景和領域可能會成爲企業產品或營銷服務中最核心的環節,並且它自己的規模變化也很是符合互聯網中的馬太效應,所以企業都須要提早爲本身將來海量的富媒體素材作好充分準備,避免數據失控。
算法
一、安防監控
根據Markets&Markets的調查結果,2017年至2022年期間,全球監控視頻市場年複合增加率將達15.4%,2022年將增至約756億美圓的規模。視頻監控普遍應用於各種場合,包括:
• 道路交通監控
• 城市安全監控
• 公共區域監控
• 家庭安防監控
最近兩年來,以幼兒園、學校表明的公共區域場所監控提出了更高的要求:
• 過去無需外網訪問的監控,如今須要作到全網實時觀看;
• 過去無需長期儲存監控畫面,如今須要作到可隨時查閱、長期存檔。
而道路交通和城市安全的監控,除了傳統的車輛違章監控和識別,行人的違章也逐步歸入到了監控的體系中,如:
• 智能識別畫面中行人的違章行爲;
• 實時識別人臉信息,快速肯定違章行人身份;
• 自動錄製違章畫面,保存證據,上傳至雲端保存。
由此能夠看到,視頻監控領域正在面臨着產業升級,如何作到公網穩定地訪問,產生的海量的圖像和視頻數據如何更好地存儲、分析和檢索,是一項巨大的挑戰。
二、在線教育
近年來,在線教育發展異常火熱,利用互聯網音視頻技術,解決了優質教育資源傳遞的時空限制,主要體現形式以下:
• 直播課堂:直播授課,講師能夠更天然地提供在線輔導;
• 實時互動:低延時音視頻傳輸,幫助教師實現和學生的實時在線交流;搭配使用聊天室功能:文字、語音、圖片、包括自定義消息等,有效地提高了課堂氛圍;
• 點播回放:經過雲端錄製以及在線回放,學生能夠隨時查看錄播視頻,對知識點進行查缺補漏,加深對知識的理解。
如何解決學生觀看直播的卡頓問題,如何進一步下降視頻互動的延時,提升老師和學生的體驗,顯得相當重要。另外,隨着人工智能的發展,視頻技術如何更好地藉助AI技術,也成爲在線教育領域你們更爲關注的方向,如:
• 智能視頻標籤:根據學生上課狀態,設置獎盃、小紅花等獎勵元素,截屏記錄孩子優秀表現的狀態,並保存,集錦視頻分享給家長;
• 智能視頻推薦:智能推薦適合學生的學習內容,包括教學視頻、講義、習題及習題講解、測試題等。
三、廣電新媒體
隨着互聯網直播興起,各種廣電平臺想要作出一檔可看且互動性強的直播節目,除了要精心編排節目內容,還要特別重視音視頻及互動方式的呈現。顯然,在新媒體時代下,傳統的廣電方案具備必定的侷限性:
• 傳統廣電接入互聯網,既要混編傳統的音視頻流,又要混編PPT文檔共享等新興數據流,保證多路畫面實時切換;
• 採用專屬線路傳輸,三網合一方案進展緩慢;
• 分辨率與碼率較低,難以知足日漸普及的4K電視需求;
• 線性播出,內容沒法回放,互動形式較爲單一;
• 缺少對視頻內容的分析能力,僅能經過固定羣體樣本,推斷出收視率等較爲粗放的參考數據。
面對這些侷限,廣電行業迫切須要全新的視頻系統,爲消費者提供高畫質、強互動的視頻娛樂體驗和可量化的精確數據管理:
• 在直播導播方面,雲端進行音畫混編服務,並在雲端切換視頻,快速造成導播效果;
• 在媒資管理方面,可對圖像、視頻進行智能拆條、智能審覈和智能編目等,實現內容匯聚的生產、審覈、管理等全套環節的智能處理,極大提高內容製做效率;
• 在內容運營方面,利用大數據能力和算法,實現用戶行爲數據標籤管理,實現內容與廣告的千家千面投放,提高廣告價值;
• 在終端播放方面,傳輸層基於寬帶網絡的4K超高清視頻傳輸,保證電視畫面的自定義時移、回看,開放場景下的也可跨屏互動、多屏互通,提高終端用戶和電視交互的便捷性和趣味性。
如何實現導播內容的實時切換,如何保證廣電內容實時傳輸,如何讓廣電傳媒的廣告價值最大化,如何製做低成本、高質量的節目,這對廣電新媒體來講均是急需解決的難題。
四、智慧法庭
2016年7月1日起,最高人民法院全部公開開庭案件均有網上直播,全部直播視頻均有視頻存檔,公衆可在線觀看。截至2018年3月,全國範圍內的庭審直播共累計66萬餘場,累計訪問近50億人次。智慧法庭充分運用互聯網、大數據、雲計算、人工智能等先進信息技術,支持全業務網上辦理、全流程依法公開、全方位智能服務:
基於視頻及文書,結合人工智能計算機視覺技術,讀取、分析電子化卷宗,抓取重要因素,並分類標註。例如把犯罪動機、犯罪時間、犯罪工具等一一以不一樣顏色打上標籤,並予以比對分析。
建設智慧法庭,如何保障開庭審訊直播視頻的實時傳輸,如何存儲海量直播視頻用於點播回放,如何基於普遍的視頻內容進行智能分析,對視頻基礎設施的可靠性提出了更高的要求和挑戰。
五、遠程醫療
當前醫療資源還存在着地區分佈不均問題,醫療專家能夠經過在線直播、實時音視頻進行跨區域互動會診:
• 臨牀交互式會診:利用視頻會議系統,患者能夠和醫生「面對面」的交流,醫生現場實時解答患者的各類問題;
• 遠程影像會診:患者經過主視頻與醫生交流,同時可經過視頻傳送病歷資料和數據,包括放射檢查影像、病理檢查圖像、心電圖、血壓圖、化驗單或保存的錄像等,還原線下會診真實場景;
• 遠程醫療培訓:經過遠程醫療培訓系統開展專題講座,傳授最新醫療信息和診療經驗,現場解答各類疑難問題,幫助聽課醫生拓展診療思路,提升下級醫院總體從業水平。
遠程醫療這一律念被提出後,已經被普遍應用。可是,如何提升視頻傳輸性能,如何確保家庭、基層醫療機構和戶外應急的遠程醫療快速接入,是當前的遠程醫療業務系統面臨的主要挑戰。
從以上列舉的幾個行業新興場景能夠看出,在產業升級的過程當中,他們都面臨着巨大的技術和資源挑戰。大部分企業沒法在短期內構建有效的相關視頻服務能力,所以如何選擇和利用公有云的相關視頻服務,快速知足業務的升級需求,顯得相當重要。
安全
爲了知足各行業在視頻時代新的需求和挑戰,智能視頻雲至少須要擁有如下5個關鍵要素:
一、穩定的網絡傳輸與分發:直播延遲不高於1s,互動延遲不高於150ms
二、可擴展的海量存儲服務:能夠實現業務層無感知PB級擴容
三、雲端媒體的編輯處理:能夠在數秒內建立獨立計算實例,執行自定義媒體編輯操做
四、視頻內容的智能分析:視頻內容識別率高於95%
五、完備的權限控制:完全杜絕非法拷貝,秒級封禁盜鏈流量
要素1:穩定的網絡傳輸與分發:提供流暢的觀看體驗與低延遲的互動
• 內容分發網絡(CDN)的優化:在傳統CDN基礎上融合優化,創建高質量全球節點,實現直播、點播內容的加速分發,進一步提供秒級首開、低延遲的視頻播放體驗。
• 實時流網絡(LiveNet):針對複雜的網絡環境、高成本的跨運營商服務和邊遠地區基礎設施落後等客觀因素,基於全球節搭建全球化實時流網絡,採用軟件定義網絡的方式,動態制定線路組合並決策調度最優線路。
• 具有完善的客戶端SDK:智能視頻雲鬚要一整套含推流、短視頻、播放器等多種SDK開發套件,幫助用戶完成視頻的生產、編輯和消費,同時還能下降移動端應用的開發難度和時間成本。
• 利用最新的編解碼技術和傳輸協議,減小對傳輸網絡帶寬和質量的要求,下降卡頓率,如P2P通訊,H.265編解碼,QUIC協議等。
• 支持標準的WebRTC協議棧,下降端到端的延時,實現百毫秒級別的音視頻互動體驗。
要素2:可擴展的海量存儲服務:高可靠易擴展的數據安全保障
• 穩健可靠的對象存儲:經過糾刪碼存儲、跨數據中心的副本冗餘等技術手段,提供高達16個9的數據可靠性,保證每一年服務不可用時間低於30s,確保存儲數據的超高可用性。
• 易擴展的技術架構:存儲系統支持動態擴充存儲節點,實現存儲需求的彈性收縮,保證PB級別的存儲內容可動態擴容,確保業務系統聚焦業務增加,無後顧之憂。
• 利用邊緣計算和邊緣存儲:將運算和存儲分散在靠近數據源的近端設備中處理,無需把數據實時回傳雲端處理,減小云平臺的工做量。大幅提升效率,下降延遲,成爲雲平臺的有效補充和和優化。
• 支持低頻存儲特性:將擁有高吞吐量,較高持久性和較低訪問延遲的數據存儲在雲端,極大下降海量存儲數據的企業運營成本,成本比常規方案下降60%,訪問延時可控制在50ms之內。
要素3:雲端媒體的編輯處理:快捷多用途雲端視頻編輯
• 快捷輕量化處理:視頻編輯的任務,本質上是針對視頻文件的數據運算與處理,經過部署靈活的容器化平臺,視頻編輯時須要的物理資源利用率可從40%提升70%以上,發佈效率提高5倍,突發業務實現秒級響應。
• 豐富的多媒體編輯能力:提供視頻轉碼、截圖、水印、旋轉、切片等多媒體數據處理服務,知足直播、點播等多種實時節目製做場景,快速完成效果製做,輸出專業製播內容。
要素4:視頻內容的智能分析:結合人工智能發揮視頻數據的最大價值
• 智能多媒體內容識別:一般包含內容審覈、OCR、場景識別、人臉識別、音視頻處理、圖片處理等豐富功能。同時,面對天天高速增加的數據處理請求,彈性擴縮容的內容識別平臺能保障服務器免受巨大壓力。
• 深度學習平臺的數據整理:一個高性能的深度學習平臺框架能夠輕鬆完成每日撰寫迭代訓練腳本、新數據的增刪和管理、增量學習和迭代學習、搭建半監督打標系統、模型的比較和融合等工做,綜合下來,能夠減小70%的重複勞動。
• 海量媒資知識庫體系由視頻結構化模塊,知識圖譜模塊和大數據檢索模塊三者組成。視頻結構化模塊完成對視頻中基礎元素和內容的提取和整理,將線性的視頻解構成能夠被碎片化使用的組件;知識圖譜用於將視頻結構化獲得的事件、人物、物體、場景等信息的有序梳理,並以便於檢索和關聯的形式進行存儲和呈現;大數據檢索模塊在前二者的基礎上,提供海量媒資內容的高效檢索,能夠根據人物特徵、人臉特徵、圖像特徵、視頻特徵及更復雜的組合結構,快速地提供視頻數據檢索服務。
要素5:完備的權限控制:杜絕非法拷貝與盜鏈
• 完備的防盜鏈機制:不管是直播仍是點播,對視頻內容的訪問,都須要有完備的防盜鏈機制,常見的防盜鏈方式有referer防盜鏈、時間戳防盜鏈、回源鑑權等多種,基本上能有效地下降盜鏈風險。同時視頻雲還應當對突發性的盜鏈流量具備感知能力與報警機制,能夠快速阻止盜鏈訪問。
• 可靠的DRM數字版權保護機制:除了防盜鏈,內容的版權保護也是視頻雲鬚要提供的能力。常見的方式是對上傳的視頻文件進行轉碼和加密,輸出加密後的視頻文件再進行網絡分發,由終端播放時再解密播放,這樣便可真正實現對內容的版權保護,防止非法拷貝。
根據以上5個關鍵要素,七牛雲認爲一套完整的智能視頻雲鬚要由如下模塊組成:

服務器
智能視頻雲不只在技術可以徹底知足各行業在視頻時代的新需求,相比自主研發,還能爲企業大幅節省研發成本和運營成本。


面對高昂的成本,視頻雲服務在提供了豐富產品的同時,還具備簡單易用、可彈性擴展、維護成本低的特色。智能視頻雲服務經過提供通用且易於根據具體業務定製的技術系統,大大下降了行業應用的開發週期與成本開銷,同時視頻雲的多個模塊都可私有或混合部署,在保障企業數據安全的同時,得到和公有云同樣的穩定性、可靠性和靈活性。
網絡
在智能視頻雲的技術和成本優點背後,人工智能,尤爲是計算機視覺技術的深度應用發揮了巨大的做用。在七牛雲整個智能視頻雲系統中,計算機視覺技術在諸多環節取代了人工操做,極大地提升了視頻內容處理的效率。經過徹底不一樣於傳統數據分析的角度,實現了先前不可思議的數據分析應用。
一、視頻內容識別:自動識別視頻畫面信息,從標籤庫中匹配對應標籤
做爲計算機視覺基礎模型層中最重要的幾項技術,人臉識別、物體識別、場景識別等技術在安防、廣電、教育等領域的衆多場景中有普遍的應用場景。
例如在安防行業,擁有人臉識別、動做追蹤等功能的高清攝像頭,能根據監控範圍內人物的動做並判斷其行爲,對具備可疑行爲的人觸發自動報警。當智能攝像頭與公安部門的在逃嫌犯資料庫匹配以後,能在機場、火車站等人流密集場所配合警方識別可疑人員,大幅提高破案、抓捕效率。
二、視頻內容結構化:能夠像搜索文本文件同樣搜索視頻文件中的信息
計算機視覺視頻結構化相比人工標註具備識別範圍廣、準確性好、學習模型不斷迭代、GPU機器效率高、成本低等一系列明顯優點。經標註後的視頻可以在遠程醫療、在線教育、廣電等行業發揮巨大做用。
例如,遠程醫療行業擁有的存量和新增影像資料遠遠超出人工標註的能力範圍,想要發揮醫療視頻資料的最大價值,須要根據不一樣類別將視頻和圖片進行分類。經過人工智能高效完成視頻精確分類後,就能像搜索文本文件同樣搜索視頻文件中的關鍵信息,進行更有效的利用,真正將醫療大數據變爲醫療知識圖譜。
三、視頻內容審覈:從視頻中識別敏感信息,提高審覈效率
現在,圖片和視頻取代文字成爲主流的傳播方式,針對圖片和視頻的內容審覈正變得愈來愈重要。然而人工審覈不只會形成高企的人力成本,其效率和準確性也很難知足當下巨大的視頻數據量帶來的審覈需求。
例如在廣電行業,視頻內容鑑黃、鑑暴恐、政治人物識別等工做過去均由人工完成。隨着計算機視覺技術的日漸成熟,利用機器代替人工進行絕大部份的內容審覈工做,成爲了視頻時代的提升審覈效率的不二之選。憑藉計算機視覺技術帶來的審覈效率革命,鑑黃、鑑暴恐、政治人物識別將再也不是廣電行業的難題。
四、視頻內容推薦:可根據用戶消費視頻習慣,實現精細化運營
除了可以高效完成視頻結構化和內容審覈工做,計算機視覺技術還能在業務層面成爲內容運營的創新引擎,實現更多個性化產品需求。
一樣在廣電行業,例如在完成視頻內容結構化以後,運營者能夠根據用戶收看行爲記錄進行智能內容推薦,甚至在視頻的特定時間段和畫面的特定位置實現廣告定向投放,最大化提高廣告轉化效果。智能視頻內容推薦可以幫助內容運營人員以最高效率實現高水平的用戶精細化運營。
架構
將來,不多有企業能脫離互聯網而獨立存在,所以企業數據的總量會不斷增長,對應產生的數據價值甚至負擔也會同步提高。每一個企業都須要擁有對於文件和富媒體素材(包含海量圖片,視頻,音頻)的使用和存儲的彈性能力,但只有極少數企業才須要擁有自建視頻雲的能力和資源,大部分企業只須要藉助一套穩定並可持續升級的視頻雲平臺,迎接將來產業中不斷變化和升級的未知挑戰。
報告出處:
Gartner白皮書英文版連接:https://www.gartner.com/techn...
Gartner白皮書中文版連接:https://www.qiniu.com/product...框架