網易易盾AI工程師出席ICME 2019 展現int8量化新算法

​​上週,全球計算機多媒體頂級會議ICME 2019(國際多媒體與博覽會議)在上海圓滿結束,網易易盾深度學習資深研發工程師姚益武受邀出席會議,展現了網易易盾在深度卷積神經網絡int8量化算法上的最新研究成果。算法

v2-e124464be8cda235cc6c35b5a7dd587b_hd.jpg

ICME籤處處安全

ICME由 IEEE 下設的計算機學會、電路與系統學會、通訊學會、信號處理學會聯合舉辦,始於 2000 年,至今已經連續舉辦了 19 屆,是計算機多媒體領域最重要的國際會議之一。ICME是學術界交流多媒體領域最近研究成果的旗艦論壇,也是工業界展現最新產品或系統的平臺,涵蓋文本分析、圖形圖像、視頻、語音音頻等多媒體數據的處理、傳輸、分析與應用等主題。網絡

在本次會議上,網易易盾深度學習資深研發工程師姚益武發表了題爲《Efficient Implementation of Convolutional Neural Networks with End to End Integer Only Dataflow》的學術論文,展現了有助於構建端到端的純整數運算通路的int8量化新算法。性能

姚益武表示,Int8量化因爲精度損失低,可以實現4倍壓縮比,且兼容於現有的整數運算單元,在產業界已經得到普遍應用,包括TensorFlow-Lite與TensorRT涉及的int8量化算法。學習

他指出,TensorFlow-Lite中的in8量化屬於線性量化方法,可是爲了執行量化卷積或矩陣乘法運算,須要提供額外的浮點乘因子,於是所構建的量化網絡並不是純整數運算通路,而且該量化算法須要藉助重訓練以恢復精度損失。編碼

「TensorRT中的線性int8量化方法,可以在NVIDIA平臺上提供高吞吐、低延遲的推理性能,深度網絡的權重按非閾值方式映射到int8區間,激活輸出則按照閾值方式完成int8量化,每一層的實現方式相對簡單。然而當前層的整數結果須要還原回浮點實數,方能傳遞至下一層,所以也不能構建端到端的純整數運算通路。」人工智能

姚益武在ICME 2019上提出的int8量化新算法有助於構建端到端的純整數運算通路,且統一表示層的設計簡化了網絡結構的拓撲設計,所以很是適合在現有硬件平臺上實現,包括CPU/GPU/FPGA等通用計算平臺。另外,所提出的int8量化算法,在複雜分類網絡與目標檢測模型上得到了與TensorRT相接近的推理精度,工業應用潛力比較大。spa

「應用於易盾內容安全圖像識別上,在確保業務模型推理精度的前提下,其服務的響應時間能獲得顯著下降。」姚益武進一步解釋了int8量化算法在網易易盾業務上的應用潛力。設計

參會的第三方專家點評網易易盾這一研究成果時表示,該方法能夠保持相對較高的準確性,有效解決TensorRT的問題。而另外個專家則更進一步指出,int8量化新算法可以簡化CNNs中的運算,並讓精度損失顯得微不足道。視頻

據悉,姚益武爲網易易盾實驗室成員,該實驗室在2018年還研發出了一種對多視角多模態特徵信息進行有效融合的自編碼器神經網絡,在準確率、NMI、Purity、ARI等各項性能指標上,較當下多項國際先進的多視角多模態信息融合技術有顯著性的領先。

網易易盾實驗室成立於2016年,隸屬於網易安所有,目前擁有數十名AI算法專家、安全研究員、政策法規研究專員等。實驗室目前專一探索人工智能技術在安全領域的應用,以及安全相關法規、社會責任等研究。

相關文章
相關標籤/搜索