struct _file_operationsnode
struct _file_operations在Fs.h這個文件裏面被定義的,以下所示:linux
struct file_operations { struct module *owner;//擁有該結構的模塊的指針,通常爲THIS_MODULES loff_t (*llseek) (struct file *, loff_t, int);//用來修改文件當前的讀寫位置 ssize_t (*read) (struct file *, char __user *, size_t, loff_t *);//從設備中同步讀取數據
ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *);//向設備發送數據 ssize_t (*aio_read) (struct kiocb *, const struct iovec *, unsigned long, loff_t);//初始化一個異步的讀取操做 ssize_t (*aio_write) (struct kiocb *, const struct iovec *, unsigned long, loff_t);//初始化一個異步的寫入操做 int (*readdir) (struct file *, void *, filldir_t);//僅用於讀取目錄,對於設備文件,該字段爲NULL unsigned int (*poll) (struct file *, struct poll_table_struct *); //輪詢函數,判斷目前是否能夠進行非阻塞的讀寫或寫入 int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long); //執行設備I/O控制命令 long (*unlocked_ioctl) (struct file *, unsigned int, unsigned long); //不使用BLK文件系統,將使用此種函數指針代替ioctl long (*compat_ioctl) (struct file *, unsigned int, unsigned long); //在64位系統上,32位的ioctl調用將使用此函數指針代替 int (*mmap) (struct file *, struct vm_area_struct *); //用於請求將設備內存映射到進程地址空間 int (*open) (struct inode *, struct file *); //打開 int (*flush) (struct file *, fl_owner_t id); int (*release) (struct inode *, struct file *); //關閉 int (*fsync) (struct file *, struct dentry *, int datasync); //刷新待處理的數據 int (*aio_fsync) (struct kiocb *, int datasync); //異步刷新待處理的數據 int (*fasync) (int, struct file *, int); //通知設備FASYNC標誌發生變化 int (*lock) (struct file *, int, struct file_lock *); ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int); unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long); int (*check_flags)(int); int (*flock) (struct file *, int, struct file_lock *); ssize_t (*splice_write)(struct pipe_inode_info *, struct file *, loff_t *, size_t, unsigned int); ssize_t (*splice_read)(struct file *, loff_t *, struct pipe_inode_info *, size_t, unsigned int); int (*setlease)(struct file *, long, struct file_lock **); };
Linux使用file_operations結構訪問驅動程序的函數,這個結構的每個成員的名字都對應着一個調用。web
用戶進程利用在對設備文件進行諸如read/write操做的時候,系統調用經過設備文件的主設備號找到相應的設備驅動程序,而後讀取這個數據結構相應的函數指針,接着把控制權交給該函數,這是Linux的設備驅動程序工做的基本原理。後端
下面是各成員解析:服務器
第一個 file_operations 成員根本不是一個操做,它是一個指向擁有這個結構的模塊的指針。網絡
這個成員用來在它的操做還在被使用時阻止模塊被卸載. 幾乎全部時間中, 它被簡單初始化爲 THIS_MODULE, 一個在 <linux/module.h> 中定義的宏.這個宏比較複雜,在進行簡單學習操做的時候,通常初始化爲THIS_MODULE。數據結構
(指針參數filp爲進行讀取信息的目標文件結構體指針;參數 p 爲文件定位的目標偏移量;參數orig爲對文件定位的起始地址,這個值能夠爲文件開頭(SEEK_SET,0,當前位置(SEEK_CUR,1),文件末尾(SEEK_END,2))app
llseek 方法用做改變文件中的當前讀/寫位置, 而且新位置做爲(正的)返回值.異步
loff_t 參數是一個"long offset", 而且就算在 32位平臺上也至少 64 位寬. 錯誤由一個負返回值指示;若是這個函數指針是 NULL, seek 調用會以潛在地沒法預知的方式修改 file 結構中的位置計數器( 在"file 結構" 一節中描述). async
(指針參數 filp 爲進行讀取信息的目標文件,指針參數buffer 爲對應放置信息的緩衝區(即用戶空間內存地址),參數size爲要讀取的信息長度,參數 p 爲讀的位置相對於文件開頭的偏移,在讀取信息後,這個指針通常都會移動,移動的值爲要讀取信息的長度值)
這個函數用來從設備中獲取數據。在這個位置的一個空指針致使 read 系統調用以 -EINVAL("Invalid argument") 失敗。一個非負返回值表明了成功讀取的字節數( 返回值是一個 "signed size" 類型, 經常是目標平臺本地的整數類型).
能夠看出,這個函數的第1、三個參數和本結構體中的read()函數的第1、三個參數是不一樣 的,異步讀寫的第三個參數直接傳遞值,而同步讀寫的第三個參數傳遞的是指針,由於AIO歷來不須要改變文件的位置。異步讀寫的第一個參數爲指向kiocb結構體的指針,而同步讀寫的第一參數爲指向file結構體的指針,每個I/O請求都對應一個kiocb結構體);初始化一個異步讀 -- 可能在函數返回前不結束的讀操做.若是這個方法是 NULL, 全部的操做會由 read 代替進行(同步地).(有關linux異步I/O,能夠參考有關的資料,《linux設備驅動開發詳解》中給出了詳細的解答)
(參數filp爲目標文件結構體指針,buffer爲要寫入文件的信息緩衝區,count爲要寫入信息的長度,ppos爲當前的偏移位置,這個值一般是用來判斷寫文件是否越界)
發送數據給設備.。若是 NULL, -EINVAL 返回給調用 write 系統調用的程序. 若是非負, 返回值表明成功寫的字節數。
(注:這個操做和上面的對文件進行讀的操做均爲阻塞操做)
初始化設備上的一個異步寫.參數類型同aio_read()函數;
對於設備文件這個成員應當爲 NULL; 它用來讀取目錄, 而且僅對文件系統有用.
(這是一個設備驅動中的輪詢函數,第一個參數爲file結構指針,第二個爲輪詢表指針)
這個函數返回設備資源的可獲取狀態,即POLLIN,POLLOUT,POLLPRI,POLLERR,POLLNVAL等宏的位「或」結果。每一個宏都代表設備的一種狀態,如:POLLIN(定義爲0x0001)意味着設備能夠無阻塞的讀,POLLOUT(定義爲0x0004)意味着設備能夠無阻塞的寫。
(poll 方法是 3 個系統調用的後端: poll, epoll, 和 select, 都用做查詢對一個或多個文件描述符的讀或寫是否會阻塞.poll 方法應當返回一個位掩碼指示是否非阻塞的讀或寫是可能的, 而且, 可能地, 提供給內核信息用來使調用進程睡眠直到 I/O 變爲可能. 若是一個驅動的 poll 方法爲 NULL, 設備假定爲不阻塞地可讀可寫.
(這裏一般將設備看做一個文件進行相關的操做,而輪詢操做的取值直接關係到設備的響應狀況,能夠是阻塞操做結果,同時也能夠是非阻塞操做結果)
(inode 和 filp 指針是對應應用程序傳遞的文件描述符 fd 的值, 和傳遞給 open 方法的相同參數.cmd 參數從用戶那裏不改變地傳下來, 而且可選的參數 arg 參數以一個 unsigned long 的形式傳遞, 無論它是否由用戶給定爲一個整數或一個指針.若是調用程序不傳遞第 3 個參數, 被驅動操做收到的 arg 值是無定義的.由於類型檢查在這個額外參數上被關閉, 編譯器不能警告你若是一個無效的參數被傳遞給 ioctl, 而且任何關聯的錯誤將難以查找.)
ioctl 系統調用提供了發出設備特定命令的方法(例如格式化軟盤的一個磁道, 這不是讀也不是寫). 另外, 幾個 ioctl 命令被內核識別而沒必要引用 fops 表.若是設備不提供 ioctl 方法, 對於任何未事先定義的請求(-ENOTTY, "設備無這樣的 ioctl"), 系統調用返回一個錯誤.
mmap 用來請求將設備內存映射到進程的地址空間。 若是這個方法是 NULL, mmap 系統調用返回 -ENODEV.
(若是想對這個函數有個完全的瞭解,那麼請看有關「進程地址空間」介紹的書籍)
(inode 爲文件節點,這個節點只有一個,不管用戶打開多少個文件,都只是對應着一個inode結構;可是filp就不一樣,只要打開一個文件,就對應着一個file結構體,file結構體一般用來追蹤文件在運行時的狀態信息)
儘管這經常是對設備文件進行的第一個操做, 不要求驅動聲明一個對應的方法. 若是這個項是 NULL, 設備打開一直成功, 可是你的驅動不會獲得通知.與open()函數對應的是release()函數。
flush 操做在進程關閉它的設備文件描述符的拷貝時調用;
它應當執行(而且等待)設備的任何未完成的操做.這個必須不要和用戶查詢請求的 fsync 操做混淆了. 當前, flush 在不多驅動中使用;SCSI 磁帶驅動使用它, 例如, 爲確保全部寫的數據在設備關閉前寫到磁帶上. 若是 flush 爲 NULL, 內核簡單地忽略用戶應用程序的請求.
release ()函數當最後一個打開設備的用戶進程執行close()系統調用的時候,內核將調用驅動程序release()函數:
void release(struct inode inode,struct file *file),release函數的主要任務是清理未結束的輸入輸出操做,釋放資源,用戶自定義排他標誌的復位等。在文件結構被釋放時引用這個操做. 如同 open, release 能夠爲 NULL.
刷新待處理的數據,容許進程把全部的髒緩衝區刷新到磁盤。
這是 fsync 方法的異步版本.所謂的fsync方法是一個系統調用函數。系統調用fsync把文件所指定的文件的全部髒緩衝區寫到磁盤中(若是須要,還包括存有索引節點的緩衝區)。相應的服務例程得到文件對象的地址,並隨後調用fsync方法。一般這個方法以調用函數__writeback_single_inode()結束,這個函數把與被選中的索引節點相關的髒頁和索引節點自己都寫回磁盤
這個函數是系統支持異步通知的設備驅動,下面是這個函數的模板:
static int ***_fasync(int fd,struct file *filp,int mode)
{
struct ***_dev * dev=filp->private_data;
return fasync_helper(fd,filp,mode,&dev->async_queue);//第四個參數爲 fasync_struct結構體指針的指針。
//這個函數是用來處理FASYNC標誌的函數。(FASYNC:表示兼容BSD的fcntl同步操做)當這個標誌改變時,驅動程序中的fasync()函數將獲得執行。 (注:感受這個‘標誌'詞用的並不恰當)
}
此操做用來通知設備它的 FASYNC 標誌的改變. 異步通知是一個高級的主題, 在第 6 章中描述.這個成員能夠是NULL 若是驅動不支持異步通知.
lock 方法用來實現文件加鎖; 加鎖對常規文件是必不可少的特性, 可是設備驅動幾乎從不實現它.
ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *);
這些方法實現發散/匯聚讀和寫操做. 應用程序偶爾須要作一個包含多個內存區的單個讀或寫操做;這些系統調用容許它們這樣作而沒必要對數據進行額外拷貝. 若是這些函數指針爲 NULL, read 和 write 方法被調用( 可能多於一次 ).
這個方法實現 sendfile 系統調用的讀, 使用最少的拷貝從一個文件描述符搬移數據到另外一個.
例如, 它被一個須要發送文件內容到一個網絡鏈接的 web 服務器使用. 設備驅動經常使 sendfile 爲 NULL.
sendpage 是 sendfile 的另外一半; 它由內核調用來發送數據, 一次一頁, 到對應的文件. 設備驅動實際上不實現 sendpage.
這個方法的目的是在進程的地址空間找一個合適的位置來映射在底層設備上的內存段中。這個任務一般由內存管理代碼進行; 這個方法存在爲了使驅動能強制特殊設備可能有的任何的對齊請求. 大部分驅動能夠置這個方法爲 NULL.[10]
這個方法容許模塊檢查傳遞給 fnctl(F_SETFL...) 調用的標誌.
這個方法在應用程序使用 fcntl 來請求目錄改變通知時調用. 只對文件系統有用; 驅動不須要實現 dir_notify.