Linux存儲結構:從理解iNode原理到掌握文件軟硬連接

做者: 阮一峯html

日期: 2011年12月 4日node

http://www.ruanyifeng.com/blog/2011/12/inode.htmlide

inode是一個重要概念,是理解Unix/Linux文件系統和硬盤儲存的基礎。spa

理解inode,不只有助於提升系統操做水平,還有助於體會Unix設計哲學,即如何把底層的複雜性抽象成一個簡單概念,從而大大簡化用戶接口。操作系統

===================================設計

bg2011120401.jpg

1、inode是什麼?htm

理解inode,要從文件儲存提及。blog

文件儲存在硬盤上,硬盤的最小存儲單位叫作"扇區"(Sector)。每一個扇區儲存512字節(至關於0.5KB)。索引

操做系統讀取硬盤的時候,不會一個個扇區地讀取,這樣效率過低,而是一次性連續讀取多個扇區,即一次性讀取一個"塊"(block)。這種由多個扇區組成的"塊",是文件存取的最小單位。"塊"的大小,最多見的是4KB,即連續八個 sector組成一個 block。接口

文件數據都儲存在"塊"中,那麼很顯然,咱們還必須找到一個地方儲存文件的元信息,好比文件的建立者、文件的建立日期、文件的大小等等。這種儲存文件元信息的區域就叫作inode,中文譯名爲"索引節點"。

每個文件都有對應的inode,裏面包含了與該文件有關的一些信息。

2、inode的內容

inode包含文件的元信息,具體來講有如下內容:

  * 文件的字節數

  * 文件擁有者的User ID

  * 文件的Group ID

  * 文件的讀、寫、執行權限

  * 文件的時間戳,共有三個:ctime指inode上一次變更的時間,mtime指文件內容上一次變更的時間,atime指文件上一次打開的時間。

  * 連接數,即有多少文件名指向這個inode

  * 文件數據block的位置

能夠用stat命令,查看某個文件的inode信息:

  stat example.txt

bg2011120402.png

總之,除了文件名之外的全部文件信息,都存在inode之中。至於爲何沒有文件名,下文會有詳細解釋。

3、inode的大小

inode也會消耗硬盤空間,因此硬盤格式化的時候,操做系統自動將硬盤分紅兩個區域。一個是數據區,存放文件數據;另外一個是inode區(inode table),存放inode所包含的信息。

每一個inode節點的大小,通常是128字節或256字節。inode節點的總數,在格式化時就給定,通常是每1KB或每2KB就設置一個inode。假定在一塊1GB的硬盤中,每一個inode節點的大小爲128字節,每1KB就設置一個inode,那麼inode table的大小就會達到128MB,佔整塊硬盤的12.8%。

查看每一個硬盤分區的inode總數和已經使用的數量,可使用df命令。

  df -i

bg2011120403.png

查看每一個inode節點的大小,能夠用以下命令:

  sudo dumpe2fs -h /dev/hda | grep "Inode size"

bg2011120404.png

因爲每一個文件都必須有一個inode,所以有可能發生inode已經用光,可是硬盤還未存滿的狀況。這時,就沒法在硬盤上建立新文件。

4、inode號碼

每一個inode都有一個號碼,操做系統用inode號碼來識別不一樣的文件。

這裏值得重複一遍,Unix/Linux系統內部不使用文件名,而使用inode號碼來識別文件。對於系統來講,文件名只是inode號碼便於識別的別稱或者綽號。

表面上,用戶經過文件名,打開文件。實際上,系統內部這個過程分紅三步:首先,系統找到這個文件名對應的inode號碼;其次,經過inode號碼,獲取inode信息;最後,根據inode信息,找到文件數據所在的block,讀出數據。

使用ls -i命令,能夠看到文件名對應的inode號碼:

  ls -i example.txt

bg2011120405.png

5、目錄文件

Unix/Linux系統中,目錄(directory)也是一種文件。打開目錄,實際上就是打開目錄文件。

目錄文件的結構很是簡單,就是一系列目錄項(dirent)的列表。每一個目錄項,由兩部分組成:所包含文件的文件名,以及該文件名對應的inode號碼。

ls命令只列出目錄文件中的全部文件名:

  ls /etc

bg2011120406.png

ls -i命令列出整個目錄文件,即文件名和inode號碼:

  ls -i /etc

bg2011120407.png

若是要查看文件的詳細信息,就必須根據inode號碼,訪問inode節點,讀取信息。ls -l命令列出文件的詳細信息。

  ls -l /etc

bg2011120408.png

理解了上面這些知識,就能理解目錄的權限。目錄文件的讀權限(r)和寫權限(w),都是針對目錄文件自己。因爲目錄文件內只有文件名和inode號碼,因此若是隻有讀權限,只能獲取文件名,沒法獲取其餘信息,由於其餘信息都儲存在inode節點中,而讀取inode節點內的信息須要目錄文件的執行權限(x)。

6、硬連接

通常狀況下,文件名和inode號碼是"一一對應"關係,每一個inode號碼對應一個文件名。可是,Unix/Linux系統容許,多個文件名指向同一個inode號碼。

這意味着,能夠用不一樣的文件名訪問一樣的內容;對文件內容進行修改,會影響到全部文件名;可是,刪除一個文件名,不影響另外一個文件名的訪問。這種狀況就被稱爲"硬連接"(hard link)。

ln命令能夠建立硬連接:

  ln 源文件 目標文件

bg2011120409.png

運行上面這條命令之後,源文件與目標文件的inode號碼相同,都指向同一個inode。inode信息中有一項叫作"連接數",記錄指向該inode的文件名總數,這時就會增長1。

反過來,刪除一個文件名,就會使得inode節點中的"連接數"減1。當這個值減到0,代表沒有文件名指向這個inode,系統就會回收這個inode號碼,以及其所對應block區域。

這裏順便說一下目錄文件的"連接數"。建立目錄時,默認會生成兩個目錄項:"."和".."。前者的inode號碼就是當前目錄的inode號碼,等同於當前目錄的"硬連接";後者的inode號碼就是當前目錄的父目錄的inode號碼,等同於父目錄的"硬連接"。因此,任何一個目錄的"硬連接"總數,老是等於2加上它的子目錄總數(含隱藏目錄)。

7、軟連接

除了硬連接之外,還有一種特殊狀況。

文件A和文件B的inode號碼雖然不同,可是文件A的內容是文件B的路徑。讀取文件A時,系統會自動將訪問者導向文件B。所以,不管打開哪個文件,最終讀取的都是文件B。這時,文件A就稱爲文件B的"軟連接"(soft link)或者"符號連接(symbolic link)。

這意味着,文件A依賴於文件B而存在,若是刪除了文件B,打開文件A就會報錯:"No such file or directory"。這是軟連接與硬連接最大的不一樣:文件A指向文件B的文件名,而不是文件B的inode號碼,文件B的inode"連接數"不會所以發生變化。

ln -s命令能夠建立軟連接。

  ln -s 源文文件或目錄 目標文件或目錄

bg2011120410.png

8、inode的特殊做用

因爲inode號碼與文件名分離,這種機制致使了一些Unix/Linux系統特有的現象。

  1. 有時,文件名包含特殊字符,沒法正常刪除。這時,直接刪除inode節點,就能起到刪除文件的做用。

  2. 移動文件或重命名文件,只是改變文件名,不影響inode號碼。

  3. 打開一個文件之後,系統就以inode號碼來識別這個文件,再也不考慮文件名。所以,一般來講,系統沒法從inode號碼得知文件名。

第3點使得軟件更新變得簡單,能夠在不關閉軟件的狀況下進行更新,不須要重啓。由於系統經過inode號碼,識別運行中的文件,不經過文件名。更新的時候,新版文件以一樣的文件名,生成一個新的inode,不會影響到運行中的文件。等到下一次運行這個軟件的時候,文件名就自動指向新版文件,舊版文件的inode則被回收。

(完)

相關文章
相關標籤/搜索