今天咱們來思考一個簡單的問題。在Linux下你用touch
命令新建一個空文件:node
touch empty_file.txt
操做完成後,是否要消耗掉咱們的一些磁盤空間?須要的話,大概能消耗多少?嗯,是的,這個問題簡單的超乎你的想象,可是不知道你否能給你本身一個滿意的答案。linux
我前面的幾篇文章都是介紹的磁盤物理層面的構成,但這對於理解文件相關的問題幫助可能還不夠。從今天開始讓咱們從物理層往上走,到Linux文件系統原理裏去尋找答案。數組
1實踐出真知數據結構
我以爲可能先丟開內核原理,直接動手操做來實驗更有意思一些。你必定知道ls
這個命令你能夠查看文件大小,那麼讓咱們就用它來看一下。
app
# touch abcdefghigklmn.txt
# ls -l
total 0
-rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file
額,ls
命令告訴我這個空文件佔用的是0。文件的大小確實是0,由於咱們尚未爲該文件寫入任何內容。可是咱們如今要思考的是,一個空文件是否佔用磁盤空間。因此直覺告訴咱們這絕對不可能,磁盤上多出來一個文件,怎麼可能一點空間開銷都沒有!ide
爲了解開這個謎底,還須要藉助df命令。輸入df –iui
# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
......
/dev/sdb1 2147361984 12785019 2134576965 1% /search
這個輸出幫咱們展現了咱們文件系統中inode的使用狀況。注意IUsed是12785019。咱們繼續新建一個空文件:spa
# touch empty_file2.txt
df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
......
/dev/sdb1 2147361984 12785020 2134576964 1% /search
這下注意IUsed變成了12785020。日誌
哈哈,咱們的一個結論就出來了。新建一個空文件會佔用一個Inode。code
2細說Inode
那麼inode裏都存了哪些和文件相關的信息呢?咱們再稍微看一下內核的源代碼。你們能夠下載一份linux的源代碼。以ext2文件系統爲例,在我下載的linux-2.6裏的文件fs/ext2/ext2.h中,能夠找到內核對於inode結構體的定義。該結構體較爲複雜,主要存儲除了文件內容之外的一些其餘數據,咱們選一些比較關鍵的截取出來:
struct ext2_inode {
__le16 i_mode; # 文件權限
__le16 i_uid; # 文件全部者ID
__le32 i_size; # 文件字節數大小
__le32 i_atime; # 文件上次被訪問的時間
__le32 i_ctime; # 文件建立時間
__le32 i_mtime; # 文件被修改的時間
__le32 i_dtime; # 文件被刪除的時間
__le16 i_gid; # 文件所屬組ID
__le16 i_links_count; # 此文件的inode被鏈接的次數
__le32 i_blocks; # 文件的block數量
......
__le32 i_block[EXT2_N_BLOCKS]; # 指向存儲文件數據的塊的數組
......
能夠看到和文件相關的所屬用戶、訪問時間等都是存在inode中的。另外在include/linux/fs.h中,還有個VFS層面的inode的定義,這裏咱就不發散了。使用stat命令就能夠直接看到文件inode中數據。
# stat test
File: `test'
Size: 0 Blocks: 0 IO Block: 1024 regular empty file
Device: 801h/2049d Inode: 26 Links: 1
Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2020-03-01 12:14:31.000000000 +0800
Modify: 2020-03-01 12:14:31.000000000 +0800
Change: 2020-03-01 12:14:31.000000000 +0800
每一個inode究竟是多大呢?dumpe2fs能夠告訴你(XFS的話使用xfs_info)。
# dumpe2fs -h /dev/mapper/vgroot-lvroot
dumpe2fs 1.41.12 (17-May-2010)
......
Inode size: 256
Inode size表示每一個Inode的大小。個人這臺機器上,每一個inode都是256字節。兩個inode的大小正好對齊到磁盤扇區的512字節。
3文件名存到哪裏了
Inode結構體都看完了,搞了半天不知道有沒有發現一個問題,inode裏並無存儲文件名!!那麼,文件名到底跑哪兒去了?
在fs/ext2/ext2.h
中,我找到了以下文件夾相關的結構體
struct ext2_dir_entry {
__le32 inode; /* Inode number */
__le16 rec_len; /* Directory entry length */
__le16 name_len; /* Name length */
char name[]; /* File name, up to EXT2_NAME_LEN */
};
這個結構體就是咱們司空見慣的文件夾所使用的數據結構。沒錯,文件名是存在其所屬的文件夾中的,就是其中的char name[]
字段。和文件名一塊兒,文件夾裏還記錄了該文件的inode號等信息。
4結論
1. 新建一個空文件須要消耗掉一個inode,用來保存用戶、建立時間等元數據。
2. 新建一個空文件還須要消耗掉其所在目錄的block中必定的空間,這些空間用來保存文件名,inode號等信息。
因此,看起來新建一個空文件而已,只要你想挖,真的能挖出不少知識的。最後分享一個咱們團隊裏同窗遇到的一個故障。咱們的一臺離線任務機直接歇菜了,重啓後排查緣由是inode被消耗光了。再追查發現一個進程建立了太多的空日誌文件。雖然文件都是空文件,可是inode卻被浪費光了。後來讓負責的同窗修改了建立日誌文件的邏輯,刪掉了多出來的空文件,該機器恢復正常。