你手裏有一塊硬盤,大小爲 1Thtml
你還有一堆文件node
這些文件在硬盤看來,就是一堆二進制數據而已linux
你準備把這些文件存儲在硬盤上,並在須要的時候讀取出來。編程
要設計怎樣的軟件,才能更方便地在硬盤中讀寫這些文件呢?數組
首先我不想和複雜的扇區,設備驅動等細節打交道,所以我先實現了一個簡單的功能,將硬盤按邏輯分紅一個個的塊,並能夠以塊爲單位進行讀寫。架構
每一個塊就定義爲兩個物理扇區的大小,即 1024 字節,就是 1KB 啦。併發
硬盤太大很差分析,咱們就假設你的硬盤只有 1MB,那麼這塊硬盤則有 1024 個塊。socket
OK,咱們開始存文件啦!佈局
準備一個文件nuxt
隨便選個塊放進去,3 號塊吧!
成功!首戰告捷!
再存一個文件!
誒?發現問題了,萬一這個文件也存到了 3 號塊,不是把原來的文件覆蓋了麼?不行,得有一個地方記錄,如今可以使用的塊有哪些,像這樣。
塊 0:未使用
塊 1:未使用
塊 2:未使用
塊 3:已使用
塊 4:未使用
...
塊 1023:未使用
那咱們就用 0 號塊,來記錄全部塊的使用狀況吧!怎麼記錄呢?
位圖!
那咱們給塊 0 起個名字,叫塊位圖,以後這個塊 0 就專門用來記錄全部塊的使用狀況,再也不用來存具體文件了。
當咱們再存入一個新文件時,只須要在塊位圖中找到第一個爲 0 的位,就能夠找到第一個還未被使用的塊,將文件存入。同時,別忘了把塊位圖中的相應位置 1。
完美!
下面,咱們嘗試讀取剛剛的文件。
咦?又遇到問題了,我怎麼找到剛剛的文件呢?根據塊號麼?這也太蠢了,就像你去書店找書,店員讓你提供書的編號,而不是書名,顯然不合理。
所以咱們給每一個文件起一個名字,叫文件名,經過它來尋找這個文件。
那必然就要有一個地方,記錄文件名與塊號的對應關係,像這樣。
葵花寶典.txt:3 號塊
數學期末複習資料.mp4:5 號塊
低併發編程的祕密.pdf:10 號塊
...
別急,既然都要選一個地方記錄文件名稱了,不妨多記錄一點咱們關心的信息吧,好比文件大小、文件建立時間、文件權限等。
這些東西天然也要保存在硬盤上,咱們選擇用一個固定大小的空間,來表示這些信息,多大空間呢?128 字節吧。
爲啥是 128 字節呢?我樂意。
咱們將這 128 字節的結構體,叫作一個 inode。
以後,咱們每存入一個新的文件,不但要佔用一個塊來存放這個文件自己,還要佔用一個 inode 來存放文件的這些元信息,而且這個 inode 的所在塊號這個字段,就指向這個文件所在的塊號。
若是一個 inode 爲 128 字節,那麼一個塊就能夠容納 8 個 inode,咱們能夠將這些 inode 編上號。
若是你以爲 inode 數不夠,也能夠用兩個或者多個塊來存放 inode 信息,但這樣用於存放數據的塊就少了,這就看你本身的平衡了。
一樣,和塊位圖管理塊的使用狀況同樣,咱們也須要一個 inode 位圖,來管理 inode 的使用狀況。咱們就把 inode 位圖,放在 1 號塊吧!
同時,咱們把 inode 信息,放在 2 號塊,一共存 8 條 inode,這樣咱們的 2 號塊就叫作 inode 表。
如今,咱們的文件系統結構,變成了下面這個樣子。
注意:塊位圖是管理可用的塊,每一位表明一個塊的使用與否。inode 位圖管理的是一條一條的 inode,並非 inode 所佔用的塊,好比上圖中有 8 條 inode,則 inode 位圖中就有 8 位是管理他們的使用與否。
如今,咱們的文件很小,一個塊就能容下。
但若是須要兩個塊、三個塊、四個塊呢?
很簡單,咱們只須要採用連續存儲法,而 inode 則只記錄文件的第一個塊,以及後面還須要多少塊,便可。
這種辦法的缺點就是:容易留下大大小小的空洞,新的文件到來之後,難以找到合適的空白塊,空間會被浪費。
看來這種方式不行,那怎麼辦呢?
既然在 inode 中記錄了文件所在的塊號,爲何不擴展一下,多記錄幾塊呢?
原來在 inode 中只記錄了一個塊號,如今擴展一下,記錄 8 個塊號!並且這些塊不須要連續。
嗯,這是個可行的辦法!
可是這也僅僅能表示 8 個塊,能記錄的最大文件是 8K(記住,一個塊是 1K), 如今的文件輕鬆就超過這個限制了,這怎麼辦?
很簡單,咱們可讓其中一個塊,做爲間接索引。
這樣瞬間就有 263 個塊(多了 256 -1 個塊)可用了,這種索引叫一級間接索引。
若是還嫌不夠,就再弄一個塊作一級間接索引,或者作二級間接索引(二級間接索引則能夠多出 256 * 256 - 1 個塊)。
咱們的文件系統,暫且先只弄一個一級間接索引。硬盤一共才 1024 個塊,一個文件 263 個塊夠大了。再大了不容許,就這麼任性。
好了,如今咱們已經能夠保存很大的文件了,而且能夠經過文件名和文件大小,將它們準確讀取出來啦!
但咱們得精益求精,咱們再想一想看這個文件系統有什麼毛病。
好比,inode 數量不夠時,咱們是怎麼得知的呢?是否是須要在 inode 位圖中找,找不到了才知道不夠用了?
一樣,對於塊數量不夠時,也是如此。
要是有個全局的地方,來記錄這一切,就行了,也方便隨時調整,好比這樣
inode 數量
空閒 inode 數量
塊數量
空閒塊數量
那咱們就再佔用一個塊來存儲這些數據吧!因爲他們看起來像是站在上帝視角來描述這個文件系統的,因此咱們把它放在最開始的塊上,並把它叫作超級塊,如今的佈局以下。
咱們繼續精益求精。
如今,塊位圖、inode 位圖、inode 表,都是是固定地佔據這塊 一、塊 二、塊 3 這三個位置。
假如以後 inode 的數量不少,使得 inode 表或者 inode 位圖須要佔據多個塊,怎麼辦?
或者,塊的數量增多(硬盤自己大了,或者每一個塊變小了),塊位圖須要佔據多個塊,怎麼辦?
程序是死的,你不告訴它哪一個塊表示什麼,它可不會本身猜。
很簡單,與超級塊記錄信息同樣,這些信息也選擇一個塊來記錄,就不怕了。那咱們就選擇緊跟在超級塊後面的 1 號塊來記錄這些信息吧,並把它稱之爲塊描述符。
固然,這些所在塊號只是記錄起始塊號,塊位圖、inode 位圖、inode 表分別均可以佔用多個塊。
好了,大功告成!
如今,咱們再嘗試存入一批文件。
誒?這看着好不爽,全部的文件都是平鋪開的,能不能擁有層級關係呢?好比這樣
咱們將葵花寶典.txt 這種稱爲普通文件,將贅婿這種稱爲目錄文件,若是要訪問贅婿1.mp4,那全文件名要寫成
贅婿/贅婿1.mp4。
如何作到這一點呢?那咱們又得把 inode 結構拿出來講事了。
此時須要一個屬性來區分這個文件是普通文件,仍是目錄文件。
缺什麼就補什麼嘛,咱們已經很熟悉了,專門加一個 4 字節,來表示文件類型。
若是是普通文件,則這個 inode 所指向的數據塊仍然和以前同樣,就是文件自己原封不動的內容。
但若是是目錄文件,則這個 inode 所指向的數據塊,就須要從新規劃了。
這個數據塊裏應該是什麼樣子呢?能夠是一個一個指向不一樣 inode 的緊挨着的結構體,好比這樣。
這樣先經過 贅婿 這個目錄文件,找到所在的數據塊。再根據這個數據塊裏的一個個帶有 inode 信息的結構體,找到這個目錄下的全部文件。
完美!
不過這樣的話,你想一想看,若是想要查看一下贅婿這個目錄下的全部文件(好比 ll 命令),將文件名和文件類型都展現出來,怎麼辦呢?
就須要把一個個結構體指向的 inode 從 inode 表中取出,再把文件名和文件類型取出,這非常浪費時間。
而讓用戶看到一個目錄下的全部文件,又是一個極其常見的操做。
因此,不如把文件名和文件類型這種常見的信息,放在數據塊中的結構體裏吧。
同時,inode 結構中的文件名,好像就沒啥用了,這種變長的東西放在這種定長的結構中自己就很討厭,早就想給它去掉了。並且還能給其餘信息省下空間,好比文件所在塊的數組,就能再多幾個了。
太好了,去掉它!
OK,大功告成,如今咱們就能夠給文件分門別類放進不一樣目錄下了,還能夠在目錄下建立目錄,無限套娃!
如今的文件系統,已經比較完善了,只是還有一點不太爽。
咱們訪問到一個目錄下,能夠很舒服地看到目錄裏的文件,而後再根據名稱訪問這個目錄下的文件或者目錄,整個過程都是一個套路。
可是,最上層的目錄下的全部文件,即根目錄,如今仍然須要經過遍歷全部的 inode 來得到,能不能和上面的套路統一呢?
答案很是簡單,咱們規定,inode 表中的 0 號 inode,就表示根目錄,一切的訪問,就從這個根目錄開始!
好了,這回沒有而後了!
咱們最後來欣賞下咱們的文件系統架構。
你是否是以爲這沒啥了不得的。但這個破玩意,它就叫文件系統
這個文件系統,和 linux 上的經典文件系統 ext2 基本相同。
下面是我畫的 ext2 文件系統的結構(字段部分只畫了核心字段)
估計你是看不清了,我說下主要異同點:
1. 超級塊前面是啓動塊,這個是 PC 聯盟給硬盤規定的 1KB 專屬空間,任何文件系統都不能用它。
2. ext2 文件系統首先將整個硬盤分爲不少塊組,但若是隻有一個塊組的話,和咱們的文件系統總體結構就徹底同樣了,分別是超級塊、塊描述符、塊位圖、inode 位圖、inode 表、數據塊。
3. ext2 文件系統的 inode 表中用 15 個塊來定位文件,其中第 13 個塊爲一級間接索引、14 個爲二級間接索引、15 個爲三級間接索引。
4. ext2 文件系統的文件類型分得更多,還有常見的如塊設備文件、字符設備文件、管道文件、socket 文件等。
5. ext2 文件系統的超級塊、塊描述符、inode 表中記錄的信息更多,但核心的和咱們的文件系統同樣,並且這些字段在後續的 ext3 和 ext4 中不斷增長,保持向前兼容。
6. ext2 文件系統的 2 號 inode 爲根目錄,而咱們的系統是 0 號 inode 爲根目錄,這個很隨意,你設計一個文件系統定一個 187 號 inode 爲根目錄也沒人攔着你。
若是你想了解 ext2 文件系統的所有細節,有三種方式。
1. 看源碼,linux1.0 後的源碼都有 ext2 文件系統的實現,源碼是最準確的。
2. 看官方文檔,這裏有個 pdf 鏈接。
https://www.nongnu.org/ext2-doc/ext2.pdf
3. 看優質博客,這裏我推薦一個。
http://docs.linuxtone.org/ebooks/C&CPP/c/ch29s02.html
4. 用 linux 的 mke2fs 命令生成一個 ext2 文件系統的磁盤鏡像,而後一個字節一個字節分析其格式。
若是看源碼和官方文檔絕不吃力,我固然主推這兩個,由於畢竟是一手資料。
但大多數人可能沒法作到,有時也沒大必要,所以也能夠看一些優質的博客。
介紹思想的,我以爲我這一篇就算是很優質的一篇了,它會帶你從設計者角度瞭解爲何這樣來設計文件系統。
介紹細節的,那些連文件系統的格式和字段都寫不對的,就別看了,因此我這裏良心推薦一篇,就是上面的方式三,能夠放心大膽,逐字逐句地食用。
最後你還能夠用方式四,本身將文件系統鏡像導出來,進行分析。
最近寫這幾篇文章,我感受對如何學會一項新的技術,有了點當心得,不知道你們是否感興趣,改天能夠找一篇來專門和你們分享一下。