Linux 的文件與曼目錄node
現代操做系統爲解決信息能獨立於進程以外被長期儲存引入了文件,文件做爲進程建立信息的邏輯單元可被多個進程併發使用。在Unix系統中,操做系統爲磁盤上的文本與圖像,鼠標與鍵盤燈輸入設備及網絡交互等 I/O 操做設計了一組通用API,使他們被處理時都可統一使用字節流方式。換言之,Unix系統中除進程以外的一切皆是文件,而Linux保持了這一特性。爲了便於文件的管理,Linux還引入了目錄(有時也被稱爲文件夾)這一律念,目錄使文件被分類管理,且目錄的引入使Linux的文件系統造成一個層級結構的目錄樹。下圖所示的是普通Linux系統的頂層目錄結構,其中/dev 是存放了設備相關文件的目錄linux
/ 根目錄 ├── bin 存放用戶二進制文件 ├── boot 存放內核引導配置文件 ├── dev 存放設備文件 ├── etc 存放系統配置文件 ├── home 用戶主目錄 ├── lib 動態共享庫 ├── lost+found 文件系統恢復時的恢復文件 ├── media 可卸載存儲介質掛載點 ├── mnt 文件系統臨時掛載點 ├── opt 附加的應用程序包 ├── proc 系統內存的映射目錄,提供內核與進程信息 ├── root root 用戶主目錄 ├── sbin 存放系統二進制文件 ├── srv 存放服務相關數據 ├── sys sys 虛擬文件系統掛載點 ├── tmp 存放臨時文件 ├── usr 存放用戶應用程序 └── var 存放郵件、系統日誌等變化文件
Linux 與其餘類Unix系統同樣並不區分文件和目錄:目錄是記錄了其餘文件名的文件。使用命令mkdir 建立目錄時,若指望建立的目錄的名稱與現有的文件名(或目錄名)重複,則會建立失敗。shell
int fd; struct input_event ie; fd = open("/dev/input/event5", O_RDONLY); read(fd, &ie, sizeof(struct input_event)); printf("type = %d code = %d value = %d\n", ie.type, ie.code, ie.value); close(fd);
# stat /home/harris/source/glibc-2.16.0.tar.xz File: `/home/harris/source/glibc-2.16.0.tar.xz' Size: 9990512 Blocks: 19520 IO Block: 4096 regular file Device: 807h/2055d Inode: 2485677 Links: 1 Access: (0600/-rw-------) Uid: ( 1000/ harris) Gid: ( 1000/ harris) ... ... # mv /home/harris/source/glibc-2.16.0.tar.xz /home/harris/Desktop/glibc.tar.xz # ls -i -F /home/harris/Desktop/glibc.tar.xz 2485677 /home/harris/Desktop/glibc.tar.xz
在 Linux 系統中查看 inode 號 可以使用命令 stat 或 ls -i(如果 AIX 系統,則使用命令 istat )。在上圖中使用命令mv移動並重命名文件glibc-2.16.0.tar.xz 其結果不影響文件的 用戶數據及inode 號,文件移動先後 inode 號均爲:2485677.數據庫
爲了解決文件的共享使用,Linux 系統引入兩種連接:硬連接(hard link)和軟連接(又稱符號連接,即soft link 或 symbolic link)。連接爲Linux系統解決了文件的共享使用,還帶來了隱藏文件路徑,增長權限安全及節省儲存等好處。若一個inode號對應多個文件名,則稱這些文件爲硬連接。換言之,硬連接就是同一個文件使用多個別名。硬連接可由命令 link 或 ln 建立。以下是對文件oldfile 建立硬連接。緩存
link oldfile newfile
ln oldfile newfile
因爲硬連接是有着相同 inode 號僅文件名不一樣的文件,所以硬連接存在如下幾個特性:安全
# ls -li total 0 // 只能對已存在的文件建立硬鏈接 # link old.file hard.link link: cannot create link `hard.link' to `old.file': No such file or directory # echo "This is an original file" > old.file # cat old.file This is an original file # stat old.file File: `old.file' Size: 25 Blocks: 8 IO Block: 4096 regular file Device: 807h/2055d Inode: 660650 Links: 2 Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root) ... // 文件有相同的 inode 號以及 data block # link old.file hard.link | ls -li total 8 660650 -rw-r--r-- 2 root root 25 Sep 1 17:44 hard.link 660650 -rw-r--r-- 2 root root 25 Sep 1 17:44 old.file // 不能交叉文件系統 # ln /dev/input/event5 /root/bfile.txt ln: failed to create hard link `/root/bfile.txt' => `/dev/input/event5': Invalid cross-device link // 不能對目錄進行建立硬鏈接 # mkdir -p old.dir/test # ln old.dir/ hardlink.dir ln: `old.dir/': hard link not allowed for directory # ls -iF 660650 hard.link 657948 old.dir/ 660650 old.file
文件 old.file 與 hard.link 有着相同的 inode 號:660650 及文件權限,inode 是隨着文件的存在而存在,所以只有當文件存在時才能夠建立硬連接,即當inode 存在且連接計數器(link count)不爲 0 時。inode 號僅在各文件系統下是惟一的,當 Linux 掛在多個文件系統後將出現 inode 號重複的現象,以下圖所示,文件 t3.jpg,sync,及123.txt 並沒有關聯,卻有着相同的 inode 號,所以硬連接建立是不可跨文件系統的。設備文件目錄/dev 使用的文件系統是 devtmpfs ,而 /root 使用的是磁盤文件系統 ext4。下圖展現了使用命令 df 查看當前系統中掛載的文件系統類型,各文件系統 inode 使用狀況及文件系統掛載點。bash
查找有相同 inode 號的文件網絡
# df -i --print-type Filesystem Type Inodes IUsed IFree IUse% Mounted on /dev/sda7 ext4 3147760 283483 2864277 10% / udev devtmpfs 496088 553 495535 1% /dev tmpfs tmpfs 499006 491 498515 1% /run none tmpfs 499006 3 499003 1% /run/lock none tmpfs 499006 15 498991 1% /run/shm /dev/sda6 fuseblk 74383900 4786 74379114 1% /media/DiskE /dev/sda8 fuseblk 29524592 19939 29504653 1% /media/DiskF # find / -inum 1114 /media/DiskE/Pictures/t3.jpg /media/DiskF/123.txt /bin/sync
值得一提的是,Linux 系統存在 inode 號被用完但磁盤空間還有剩餘的狀況。咱們建立一個5M大小的ext4類型的mo.img文件,並將其掛載至/mnt。而後咱們使用一個shell腳本將其掛載在 /mnt 下ext4文件系統的inode 耗盡,下圖架構
# dd if=/dev/zero of=mo.img bs=5120k count=1 # ls -lh mo.img -rw-r--r-- 1 root root 5.0M Sep 1 17:54 mo.img # mkfs -t ext4 -F ./mo.img ... OS type: Linux Block size=1024 (log=0) Fragment size=1024 (log=0) Stride=0 blocks, Stripe width=0 blocks 1280 inodes, 5120 blocks 256 blocks (5.00%) reserved for the super user ... ... Writing superblocks and filesystem accounting information: done # mount -o loop ./mo.img /mnt # cat /mnt/inode_test.sh #!/bin/bash for ((i = 1; ; i++)) do if [ $? -eq 0 ]; then echo "This is file_$i" > file_$i else exit 0 fi done # ./inode_test.sh ./inode_test.sh: line 6: file_1269: No space left on device # df -iT /mnt/; du -sh /mnt/ Filesystem Type Inodes IUsed IFree IUse% Mounted on /dev/loop0 ext4 1280 1280 0 100% /mnt 1.3M /mnt/
硬連接不能對目錄建立是受限於文件系統的設計。現 Linux 文件系統中的目錄均隱藏了兩個特殊的目錄:當前目錄(.)與父目錄(..)。查看這兩個特殊目錄的 inode 號可知其實這兩目錄就是兩個硬連接(注意目錄 /mnt/lost+found/ 的 inode 號)。若系統容許對目錄建立硬連接,則會產生目錄環。併發
# ls -aliF /mnt/lost+found total 44 11 drwx------ 2 root root 12288 Sep 1 17:54 ./ 2 drwxr-xr-x 3 root root 31744 Sep 1 17:57 ../ # stat /mnt/lost+found/ File: `/mnt/lost+found/' Size: 12288 Blocks: 24 IO Block: 1024 directory Device: 700h/1792d Inode: 11 Links: 2 Access: (0700/drwx------) Uid: ( 0/ root) Gid: ( 0/ root) Access: 2012-09-01 17:57:17.000000000 +0800 Modify: 2012-09-01 17:54:49.000000000 +0800 Change: 2012-09-01 17:54:49.000000000 +0800 Birth: -
軟連接與硬連接不一樣,若文件用戶數據塊中存放的內容是另外一個文件的路徑名的指向,則該文件就是軟連接。軟連接就是一個普通文件,只是數據庫內容有點特殊。軟連接有着本身的 inode 號以及用戶數據塊。所以軟連接的建立與使用沒有相似硬連接的諸多限制:
軟連接的訪問
# ls -li total 0 // 可對不存在的文件建立軟連接 # ln -s old.file soft.link # ls -liF total 0 789467 lrwxrwxrwx 1 root root 8 Sep 1 18:00 soft.link -> old.file // 因爲被指向的文件不存在,此時的軟連接 soft.link 就是死連接 # cat soft.link cat: soft.link: No such file or directory // 建立被指向的文件 old.file,soft.link 恢復成正常的軟連接 # echo "This is an original file_A" >> old.file # cat soft.link This is an original file_A // 對不存在的目錄建立軟連接 # ln -s old.dir soft.link.dir # mkdir -p old.dir/test # tree . -F --inodes . ├── [ 789497] old.dir/ │ └── [ 789498] test/ ├── [ 789495] old.file ├── [ 789495] soft.link -> old.file └── [ 789497] soft.link.dir -> old.dir/
固然軟連接的用戶數據也能夠是另外一個軟連接的路徑,其解析過程是遞歸的。但需注意:軟連接建立時原文件的路徑指向使用絕對路徑較好。使用相對路徑建立的軟連接被移動後該軟連接文件成爲死連接
$ ls -li total 2136 656627 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 a -> data.txt 656662 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 b -> a 656228 -rw------- 1 harris harris 2186738 Sep 1 14:37 data.txt 6
連接相關命令
在 Linux 中查看當前系統已掛着的文件系統類型除上述使用命令df ,還可使用命令 mount 或查看文件 /proc/mounts
# mount /dev/sda7 on / type ext4 (rw,errors=remount-ro) proc on /proc type proc (rw,noexec,nosuid,nodev) sysfs on /sys type sysfs (rw,noexec,nosuid,nodev) ... ... none on /run/shm type tmpfs (rw,nosuid,nodev)
命令 ls 或 stat 可幫助咱們區分軟連接與其餘文件並查看文件 inode 號,但較好的方式仍是使用 find 命令,其不只可查找某文件的軟連接,還能夠用於查找相同 inode 的全部硬連接
// 查找在路徑 /home 下的文件 data.txt 的軟連接 # find /home -lname data.txt /home/harris/debug/test2/a // 查看路徑 /home 有相同 inode 的全部硬連接 # find /home -samefile /home/harris/debug/test3/old.file /home/harris/debug/test3/hard.link /home/harris/debug/test3/old.file # find /home -inum 660650 /home/harris/debug/test3/hard.link /home/harris/debug/test3/old.file // 列出路徑 /home/harris/debug/ 下的全部軟連接文件 # find /home/harris/debug/ -type l -ls 656662 0 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 /home/harris/debug/test2/b -> a 656627 0 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 /home/harris/debug/test2/a -> data.txt 789467 0 lrwxrwxrwx 1 root root 8 Sep 1 18:00 /home/harris/debug/test/soft.link -> old.file 789496 0 lrwxrwxrwx 1 root root 7 Sep 1 18:01 /home/harris/debug/test/soft.link.dir -> old.dir
系統根據磁盤的大小默認設定了 inode 的值,如若必要,可在格式文件系統前對該值進行修改。如鍵入命令 mkfs -t ext4 -I 512/dev/sda4 ,將使磁盤設備 /dev/sda4 格式成 inode 大小是 512 字節的 ext4文件系統。
// 查看磁盤分區 /dev/sda7 上的 inode 值 # dumpe2fs -h /dev/sda7 | grep "Inode size" dumpe2fs 1.42 (29-Nov-2011) Inode size: 256 # tune2fs -l /dev/sda7 | grep "Inode size" Inode size: 256
Linux VFS
Linux 有着極其豐富的文件系統,大致上可分以下幾類:
實現以上這些文件系統並在Linux 下共存的基礎就是 Linux VFS (Virtual File System 又稱 Virtual Filesystem Switch),即虛擬文件系統。VFS 做爲一個通用的文件系統,抽象了文件系統的四個基本概念:文件,目錄項(dentry),索引節點(inode)即掛載點,其在內核中爲用戶空間層的文件系統提供了相關接口。VFS實現了 open(),read() 等系統調用使得cp等用戶空間程序可跨文件系統。VFS真正實現了上述內容中:在Linux 中除進程以外一切皆是文件。
VFS 在系統中的架構
Linux VFS 存在四個基本對象:超級塊對象(superblock object),索引節點對象(inode object),目錄項對象(dentry object)及文件對象(file object)。超級塊對象表明一個已安裝的文件系統;索引節點對象表明一個文件;目錄項對象表明一個目錄項,如設備文件 event5 在路徑 /dev/input/event5 中,其存在四個目錄項對象:/、dev/、input/、event5。文件對象表明由進程打開的文件。這四個對象與進程及磁盤文件建的關係以下圖,其中 d_inode 即爲硬連接。爲文件路徑的快速解析,Linux VFS 設計了目錄項緩存(Directory EntryCach,即 dcache)。
VFS的對象之間的處理
Linux 文件系統中的 inode
在 Linux 中,索引節點結構存在於系統內存及磁盤,其可區分紅 VFS inode 與實際文件系統的 inode。VFS inode 做爲實際文件系統中 inode 的抽象,定義告終構體 inode 與其相關的操做 inode_operations
VFS 中的 inode 與 inode_operations 結構體
struct inode { ... const struct inode_operations *i_op; // 索引節點操做 unsigned long i_ino; //索引節點號 atomic_t i_count; //引用計數器 unsigned int i_nlink; // 硬連接數碼 ... } struct inode_operationis { ... int (*create) (struct inode *, struct dentry *, int struct nameidata *); int (*link) (struct dentry *, struct inode *, struct dentry *); int (*unlink) (struct inode *, struct dentry *); int (*synlink) (struct inode *, struct dentry *, const char *); int (*mkdir) (struct inode *,struct dentry *,int); int (*rmdir) (struct inode *,struct dentry *); ... }
如上圖所見,每一個文件存在兩個計數器:i_count 與 i_nlink,即引用計數與硬連接計數。結構體 inode 中的 i_count 用於跟蹤文件被訪問的數量,而 i_nlink 則是上述使用 ls -l 等命令查看到的文件硬連接數。或者說 i_count 跟蹤文件在內存中的狀況,而 i_nlink 則是磁盤計數器。當文件被刪除時,則 i_nlink 先被設置成0,文件的這個兩個計數器使得Linux 系統升級或程序更新變得容易。系統或程序可在不關閉的狀況下(即文件 i_count 不爲 0 ),將新文件已一樣的文件名進行替換,新的文件有本身的 inode 及 data block,舊文件會在相關進程關閉後被完整的刪除。
文件系統 ext4 中的 inode
struct ext_inode { ... __le32 i_atime; // 文件內容最後一次訪問的時間 __le32 i_ctime; // inode修改時間 __le32 i_mtime; // 文件內容最後一次修改時間 __le16 i_links_count; // 硬連接計數 __le32 i_block2_lo; // Block 計數 __le32 i_block[EXT$_N_BLOCKS]; // 指向具體的block ... };
上圖展現的是文件系統 ext4 中對 inode 的定義(見內核源碼 fs/ext4/ext4.h)。其中三個時間的定義可對應於命令 stat 中看到三個時間。i_links_count 不只用於文件的硬連接計數,也用於目錄數跟蹤(目錄並不顯示硬連接數, 命令 ls -ld 查看到的是子目錄數)。因爲文件系統 ext3 對i_links_count 有限制,其最大數爲:32000(該限制在 ext4 中被取消)。
結束語
本文最初描述了 Linux 系統中文件與目錄被引入的緣由及 Linux 處理文件的方式,而後咱們經過區分硬連接與軟連接的不一樣,瞭解 Linux 中的索引節點的相關知識,並以此引出了 inode 的結構體。索引節點結構體存在於 Linux VFS 以及實際文件系統中,VFS 做爲通用文件模型是 Linux 中 「一切皆是文件」 的實現的基礎。文章並未深刻 Linux VFS ,也沒有涉及實際文件系統的實現,文章只是從 inode 瞭解 Linux 的文件系統的相關內容。若想深刻文件系統的內容,查看內核文檔 Documentation/filesystems/。