CPU TFLOPS 計算

時間 2019-11-26

標籤 cpu tflops 計算简体版

原文原文鏈接

CPU TFLOPS 計算node

姚偉峯
yaoweifeng0301@126.com]
http://www.cnblogs.com/Matrix_Yao/socket

深度學習任務是一個計算密集型任務，因此很關注計算設備的算力指標，由於目前深度學習仍是以float32爲主流，因此落實到具體指標，就變成了你們都很關心TFLOPS(Tera FLoat point OPerations per Second)，這裏，浮點操做指的就是浮點乘法和加法操做。這個在GPU上是明碼寫在spec裏能夠查的，但CPU目前並不會在spec中暴露TFLOPS指標。一種方法能夠經過跑BLAS的benchmark來測量的，但這個一是須要必定的操做成本，二是受軟件優化的影響（因此，若是出了問題就容易不知道這是硬件能力不行仍是軟件優化沒到位）。須要一個對硬件能力的直接估計。
在深度學習任務中，計算量的絕大部分是由協處理器(co-processor)來完成的(如SSE，AVX2，AVX-512)，更具體地，是由FMA(Fused Multiply-Add)單元完成的。因此對CPU的TFLOPS估計通常能夠經過如下公式來達成：
學習