《深刻理解計算機系統》自學歷程（一）模擬高速緩存邏輯（上）

時間 2019-11-30

原文原文鏈接

《深刻理解計算機系統》筆記git

1、首先複習一下

　　存儲越大尋址時間越慢、效率越低，雖然相對來講每個數據計算機都會用到，但在某一階段、某一個特定時間，使用到的數據範圍是相對固定的。緩存

　　處理器須要更快速的處理速度，須要快速獲得指令和數據，而這些指令和數據都是存在低級的存儲中（硬盤等本地存儲或網絡存儲），單純拿硬盤來講，讀取時間就包括了傳輸時間、旋轉時間、尋道時間，效率過低。爲了更快速的讓處理器獲得數據，更好的利用處理器的性能，現代處理器演化出了分支預測的功能單元，可讓處理器在未執行到某一個分支以前就經過投機先行計算（不在本次範圍內）。另外，除了內部的文件寄存器，計算機將處理器和主存之間增長了多級緩存，用來存放處理器須要用到的指令和數據。所以，處理器在活動時能夠經過分支預測等技術同步的將後續將會使用到的指令和數據加載到緩存中（指令高速緩存/數據高速緩存），可讓整個處理器流水線的效率更高。網絡

　　注：L0，L1，L2，L3級緩存的效率都是成百倍的下降，L4主存的效率相比L1更是天差地別。客觀條件相同的狀況下，存儲越大尋址速度越慢。雖說從材料上面來講也有不一樣，不僅僅是大小的問題，但材料方面不在本次討論範圍內。性能

2、緩存

　　緩存是低層次存儲的緩存，或者說是對低層次緩存的「凝練和融合」（L1是L2的緩存，L2是L3的緩存）。經過創建一套規則和邏輯，咱們將低層次存儲中的數據根據須要讀取到高層次緩存中。spa

　　本次說到的高速緩存的結構劃分爲如下幾個部分（概念）設計

　　組　　行　　數據塊指針

　　S　　 E　　 blockcode

　　一個高速緩存的大小（C）就是 S*E*B（blockSize） 其中 B S 必須是2的N次冪blog

　2.1 爲何要這麼劃分？

　　咱們須要一套機制，將內存地址與高速緩存的索引之間創建關係，上面說的方式就是其中一種。索引

　　S表明了高速緩存的組數，E表明了每組中的行數，B表明每行中的數據塊大小，經過這S值和B值，咱們就能夠對內存地址進行掩碼處理，並獲得相應的組值和數據塊偏移。

簡單分步驟的說：

　　　　1）計算機中的信息是用二進制表示的。

　　　　2）S組都是 2的N次冪，表明他們都是經過範圍的2進制位數表示的（若是S=5，那麼值就多是0,1,10,11,100,101；但三位二進數還有1十、111的值，就沒法用三位截取地址的方式來計算組索引了）

　　　　3）B數據塊也是2的N次冪，緣由同S。

　　因此 s = log2（S）就是組索引在地址中的位數，b = log2（B）就是數據塊偏移的位數。

　　1000 1000 1000 1000

　　 t s b

　2.2 t是什麼？

　　t表明標識，設想一下，既然是緩存，那麼就是將低級存儲進行緩存，大小必定是比低級存儲更小，因此速度更快。更小表明着較多的數據要使用較小的位置，也就是說多個地址的數據使用一個緩存位置來存數（覆蓋什麼規則後期再談），那麼久須要一個標識來表示這個緩存單元中的數究竟是哪一個內存的，不然讀取數據的時候都不知道該讀哪一個了。

　　t的公式是 memAddrLength - b - s。就是說，去掉組索引位和數據塊偏移位，剩下的就是標識位了。