Intel CPU指令集以及運算加速

時間 2019-11-15

標籤 intel cpu 指令以及運算加速欄目 Intel 简体版

原文原文鏈接

前沿html

人工智能運算分析依賴CPU和顯卡的運算能力。查詢CPU支持的指令集，當前加速會用到AVX2指令集,如何查詢是否支持架構

工具下載ide

https://www.cpuid.com/softwares/cpu-z.html工具

AMD Ryzen Threadripper 3000 preliminary support
Intel Ice-Lake preliminary support
NVIDIA RTX 2070 and 2080 Super性能

下載ZIP.CHINESE
https://www.cpuid.com/downloads/cpu-z/cpu-z_1.90-cn.zipui

Linux的查詢指令cat /proc/cpuinfo 編碼

知識儲備人工智能

AVX2指令集：AVX指令集的增強版
　　對於指令集和AVX指令集不瞭解的朋友能夠先看看《AVX是什麼？AVX指令集技術與應用解析》。當年AVX在SSE4指令集的基礎上加入了256位矢量寬度、加強的數據排序、3/4個操做數、不對齊內存存取以及VEX編碼方式，最直接的收益就是浮點性能最大提高了2倍。htm

AVX2的新內容
　　在2011年發佈的AVX2則在此基礎上加入瞭如下新內容：
　　-整數SIMD指令擴展至256位
　　-2個新FMA（融合乘加，即±(a×b)±c）單元及浮點FMA指令
　　-離散數據加載指令「gather」、新的位移和廣播指令
理論性能：整數和浮點性能翻倍
　　其中最爲重要的是對256位的整數SIMD的支持，並新增60條256位浮點SIMD指令，完善從AVX開始的256位擴展，理論上可再次提高整數和浮點運算速度。排序

新FMA單元和指令帶來更強的性能　　 FMA則關係到浮點運算能力。Haswell架構中擁有2個新的FMA單元（Intel的FMA3指令），每一個FMA單元支持8個單精度或4個雙精度浮點數，每週期單/雙精度FLOPs都要比AVX高1倍。　　 FMA擁有20種指令形式，與3種操做數次序組合，造成60種新指令，爲選擇內存操做數或目的操做數提供了極大的靈活性。另外融合乘加還會自動選擇多項式的計算過程，下降了延遲。