Intel CPU指令集以及運算加速

前沿html

           人工智能運算分析依賴CPU和顯卡的運算能力 。查詢CPU支持的指令集,當前加速會用到AVX2指令集,如何查詢是否支持架構


工具下載ide

https://www.cpuid.com/softwares/cpu-z.html工具

AMD Ryzen Threadripper 3000 preliminary support
Intel Ice-Lake preliminary support
NVIDIA RTX 2070 and 2080 Super性能

下載ZIP.CHINESE
https://www.cpuid.com/downloads/cpu-z/cpu-z_1.90-cn.zipui


Linux的查詢指令cat /proc/cpuinfo 編碼


知識儲備人工智能

AVX2指令集:AVX指令集的增強版
   對於指令集和AVX指令集不瞭解的朋友能夠先看看《AVX是什麼?AVX指令集技術與應用解析》。當年AVX在SSE4指令集的基礎上加入了256位矢量寬度、加強的數據排序、3/4個操做數、不對齊內存存取以及VEX編碼方式,最直接的收益就是浮點性能最大提高了2倍。htm

AVX2的新內容
   在2011年發佈的AVX2則在此基礎上加入瞭如下新內容:
  -整數SIMD指令擴展至256位
  -2個新FMA(融合乘加,即±(a×b)±c)單元及浮點FMA指令
  -離散數據加載指令「gather」、新的位移和廣播指令
理論性能:整數和浮點性能翻倍
  其中最爲重要的是對256位的整數SIMD的支持,並新增60條256位浮點SIMD指令,完善從AVX開始的256位擴展,理論上可再次提高整數和浮點運算速度。排序

新FMA單元和指令帶來更強的性能   FMA則關係到浮點運算能力。Haswell架構中擁有2個新的FMA單元(Intel的FMA3指令),每一個FMA單元支持8個單精度或4個雙精度浮點數,每週期單/雙精度FLOPs都要比AVX高1倍。   FMA擁有20種指令形式,與3種操做數次序組合,造成60種新指令,爲選擇內存操做數或目的操做數提供了極大的靈活性。另外融合乘加還會自動選擇多項式的計算過程,下降了延遲。

相關文章
相關標籤/搜索