HNU計算機系統實驗緩存7&緩存8

一、test-trans 64x64矩陣轉置實驗: 1、64×64矩陣,每行64元素,每8一組32位分8個組,故cache每4行填滿整個cache。 2、測試傳統8分塊,結果如圖,發塊與不分快結果一樣,沒有優化。 這是因爲A數組8x8讀取數據的時候與之前一樣,都是每組第一個miss以後hit,但是B數組按列存的時候,因爲每四行一個塊,在訪問後四行的時候將前四行驅逐miss,然後訪問第二列的時候又把
相關文章
相關標籤/搜索