4k aliasing對分塊算法的影響和lapacke中行列主序的問題

時間 2021-01-01

標籤 lapack mkl openblas cache 分塊简体版

原文原文鏈接

由於程序運行時間測量的不準確性，雖然測量時間時已經採取了運行多次取中位值的方法，我不保證能夠重現結果。下圖是使用dgemm()矩陣乘法用時計算所得CPU浮點計算能力（Gflops，y軸，越大越好）隨運行時間（x軸）變化的曲線。可見1950x(3.4G,3.75G最上面紅藍黑三條)的波動是非常劇烈的，偶爾還會來個尖峯或者波谷，最上面的紅線要穩定些應該是因爲排除了4K alisaing的影響。倒數第

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。