在linux中inode結構用於表示文件,而file結構則表示打開的文件的描述,由於對於單個文件而言可能會有許多個表示打開的文件的描述符,於是就可能會的對應有多個file結構,可是都指向單個inode結構。php
在系統內部,I/O設備的存取操做經過特定的的入口來進行,而這組特定的入口由驅動程序來提供的。一般這組設備驅動的接口是由結構體file_operations向系統說明的node
第一個 file_operations 成員根本不是一個操做; 它是一個指向擁有這個結構的模塊的指針. 這個成員用來在它的操做還在被使用時阻止模塊被卸載. 幾乎全部時間中, 它被簡單初始化爲 THIS_MODULE, 一個在 中定義的宏.這個宏比較複雜,在進行簡單學習操做的時候,通常初始化爲THIS_MODULE。 loff_t (*llseek) (struct file * filp , loff_t p, int orig); (指針參數filp爲進行讀取信息的目標文件結構體指針;參數 p 爲文件定位的目標偏移量;參數orig爲對文件定位 的起始地址,這個值能夠爲文件開頭(SEEK_SET,0,當前位置(SEEK_CUR,1),文件末尾(SEEK_END,2)) llseek 方法用做改變文件中的當前讀/寫位置, 而且新位置做爲(正的)返回值. loff_t 參數是一個"long offset", 而且就算在 32位平臺上也至少 64 位寬. 錯誤由一個負返回值指示. 若是這個函數指針是 NULL, seek 調用會以潛在地沒法預知的方式修改 file 結構中的位置計數器( 在"file 結構" 一節中描述). ssize_t (*read) (struct file * filp, char __user * buffer, size_t size , loff_t * p); (指針參數 filp 爲進行讀取信息的目標文件,指針參數buffer 爲對應放置信息的緩衝區(即用戶空間內存地址), 參數size爲要讀取的信息長度,參數 p 爲讀的位置相對於文件開頭的偏移,在讀取信息後,這個指針通常都會移動,移動的值爲要讀取信息的長度值) 這個函數用來從設備中獲取數據. 在這個位置的一個空指針致使 read 系統調用以 -EINVAL("Invalid argument") 失敗. 一個非負返回值表明了成功讀取的字節數( 返回值是一個 "signed size" 類型, 經常是目標平臺本地的整數類型). ssize_t (*aio_read)(struct kiocb * , char __user * buffer, size_t size , loff_t p); 能夠看出,這個函數的第1、三個參數和本結構體中的read()函數的第1、三個參數是不一樣 的, 異步讀寫的第三個參數直接傳遞值,而同步讀寫的第三個參數傳遞的是指針,由於AIO歷來不須要改變文件的位置。 異步讀寫的第一個參數爲指向kiocb結構體的指針,而同步讀寫的第一參數爲指向file結構體的指針,每個I/O請求都對應一個kiocb結構體); 初始化一個異步讀 -- 可能在函數返回前不結束的讀操做.若是這個方法是 NULL, 全部的操做會由 read 代替進行(同步地). (有關linux異步I/O,能夠參考有關的資料,《linux設備驅動開發詳解》中給出了詳細的解答) ssize_t (*write) (struct file * filp, const char __user * buffer, size_t count, loff_t * ppos); (參數filp爲目標文件結構體指針,buffer爲要寫入文件的信息緩衝區,count爲要寫入信息的長度, ppos爲當前的偏移位置,這個值一般是用來判斷寫文件是否越界) 發送數據給設備. 若是 NULL, -EINVAL 返回給調用 write 系統調用的程序. 若是非負, 返回值表明成功寫的字節數. (注:這個操做和上面的對文件進行讀的操做均爲阻塞操做) ssize_t (*aio_write)(struct kiocb *, const char __user * buffer, size_t count, loff_t * ppos); 初始化設備上的一個異步寫.參數類型同aio_read()函數; int (*readdir) (struct file * filp, void *, filldir_t); 對於設備文件這個成員應當爲 NULL; 它用來讀取目錄, 而且僅對文件系統有用. unsigned int (*poll) (struct file *, struct poll_table_struct *); (這是一個設備驅動中的輪詢函數,第一個參數爲file結構指針,第二個爲輪詢表指針) 這個函數返回設備資源的可獲取狀態,即POLLIN,POLLOUT,POLLPRI,POLLERR,POLLNVAL等宏的位「或」結果。 每一個宏都代表設備的一種狀態,如:POLLIN(定義爲0x0001)意味着設備能夠無阻塞的讀,POLLOUT(定義爲0x0004)意味着設備能夠無阻塞的寫。 (poll 方法是 3 個系統調用的後端: poll, epoll, 和 select, 都用做查詢對一個或多個文件描述符的讀或寫是否會阻塞. poll 方法應當返回一個位掩碼指示是否非阻塞的讀或寫是可能的, 而且, 可能地, 提供給內核信息用來使調用進程睡眠直到 I/O 變爲可能. 若是一個驅動的 poll 方法爲 NULL, 設備假定爲不阻塞地可讀可寫. (這裏一般將設備看做一個文件進行相關的操做,而輪詢操做的取值直接關係到設備的響應狀況,能夠是阻塞操做結果,同時也能夠是非阻塞操做結果) int (*ioctl) (struct inode *inode, struct file *filp, unsigned int cmd, unsigned long arg); (inode 和 filp 指針是對應應用程序傳遞的文件描述符 fd 的值, 和傳遞給 open 方法的相同參數. cmd 參數從用戶那裏不改變地傳下來, 而且可選的參數 arg 參數以一個 unsigned long 的形式傳遞, 無論它是否由用戶給定爲一個整數或一個指針. 若是調用程序不傳遞第 3 個參數, 被驅動操做收到的 arg 值是無定義的. 由於類型檢查在這個額外參數上被關閉, 編譯器不能警告你若是一個無效的參數被傳遞給 ioctl, 而且任何關聯的錯誤將難以查找.) ioctl 系統調用提供了發出設備特定命令的方法(例如格式化軟盤的一個磁道, 這不是讀也不是寫). 另外, 幾個 ioctl 命令被內核識別而沒必要引用 fops 表. 若是設備不提供 ioctl 方法, 對於任何未事先定義的請求(-ENOTTY, "設備無這樣的 ioctl"), 系統調用返回一個錯誤. int (*mmap) (struct file *, struct vm_area_struct *); mmap 用來請求將設備內存映射到進程的地址空間. 若是這個方法是 NULL, mmap 系統調用返回 -ENODEV. (若是想對這個函數有個完全的瞭解,那麼請看有關「進程地址空間」介紹的書籍) int (*open) (struct inode * inode , struct file * filp ) ; (inode 爲文件節點,這個節點只有一個,不管用戶打開多少個文件,都只是對應着一個inode結構; 可是filp就不一樣,只要打開一個文件,就對應着一個file結構體,file結構體一般用來追蹤文件在運行時的狀態信息) 儘管這經常是對設備文件進行的第一個操做, 不要求驅動聲明一個對應的方法. 若是這個項是 NULL, 設備打開一直成功, 可是你的驅動不會獲得通知. 與open()函數對應的是release()函數。 int (*flush) (struct file *); flush 操做在進程關閉它的設備文件描述符的拷貝時調用; 它應當執行(而且等待)設備的任何未完成的操做. 這個必須不要和用戶查詢請求的 fsync 操做混淆了. 當前, flush 在不多驅動中使用; SCSI 磁帶驅動使用它, 例如, 爲確保全部寫的數據在設備關閉前寫到磁帶上. 若是 flush 爲 NULL, 內核簡單地忽略用戶應用程序的請求. int (*release) (struct inode *, struct file *); release ()函數當最後一個打開設備的用戶進程執行close()系統調用的時候,內核將調用驅動程序release()函數: void release(struct inode inode,struct file *file),release函數的主要任務是清理未結束的輸入輸出操做,釋放資源,用戶自定義排他標誌的復位等。 在文件結構被釋放時引用這個操做. 如同 open, release 能夠爲 NULL. int(*synch)(struct file *,struct dentry *,int datasync); 刷新待處理的數據,容許進程把全部的髒緩衝區刷新到磁盤。 int (*aio_fsync)(struct kiocb *, int); 這是 fsync 方法的異步版本.所謂的fsync方法是一個系統調用函數。系統調用fsync 把文件所指定的文件的全部髒緩衝區寫到磁盤中(若是須要,還包括存有索引節點的緩衝區)。 相應的服務例程得到文件對象的地址,並隨後調用fsync方法。一般這個方法以調用函數__writeback_single_inode()結束, 這個函數把與被選中的索引節點相關的髒頁和索引節點自己都寫回磁盤。 int (*fasync) (int, struct file *, int); 這個函數是系統支持異步通知的設備驅動,下面是這個函數的模板: static int ***_fasync(int fd,struct file *filp,int mode) { struct ***_dev * dev=filp->private_data; return fasync_helper(fd,filp,mode,&dev->async_queue);//第四個參數爲 fasync_struct結構體指針的指針。 //這個函數是用來處理FASYNC標誌的函數。(FASYNC:表示兼容BSD的fcntl同步操做)當這個標誌改變時,驅動程序中的fasync()函數將獲得執行。 (注:感受這個‘標誌'詞用的並不恰當)}此操做用來通知設備它的 FASYNC 標誌的改變. 異步通知是一個高級的主題, 在第 6 章中描述.這個成員能夠是NULL 若是驅動不支持異步通知.int (*lock) (struct file *, int, struct file_lock *);lock 方法用來實現文件加鎖; 加鎖對常規文件是必不可少的特性, 可是設備驅動幾乎從不實現它.ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *);ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *);這些方法實現發散/匯聚讀和寫操做. 應用程序偶爾須要作一個包含多個內存區的單個讀或寫操做;這些系統調用容許它們這樣作而沒必要對數據進行額外拷貝. 若是這些函數指針爲 NULL, read 和 write 方法被調用( 可能多於一次 ).ssize_t (*sendfile)(struct file *, loff_t *, size_t, read_actor_t, void *);這個方法實現 sendfile 系統調用的讀, 使用最少的拷貝從一個文件描述符搬移數據到另外一個.例如, 它被一個須要發送文件內容到一個網絡鏈接的 web 服務器使用. 設備驅動經常使 sendfile 爲 NULL.ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);sendpage 是 sendfile 的另外一半; 它由內核調用來發送數據, 一次一頁, 到對應的文件. 設備驅動實際上不實現 sendpage.unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);這個方法的目的是在進程的地址空間找一個合適的位置來映射在底層設備上的內存段中.這個任務一般由內存管理代碼進行; 這個方法存在爲了使驅動能強制特殊設備可能有的任何的對齊請求. 大部分驅動能夠置這個方法爲 NULL.[10]int (*check_flags)(int)這個方法容許模塊檢查傳遞給 fnctl(F_SETFL...) 調用的標誌.int (*dir_notify)(struct file *, unsigned long);這個方法在應用程序使用 fcntl 來請求目錄改變通知時調用. 只對文件系統有用; 驅動不須要實現 dir_notify.通常狀況下,進行設備驅動程序的設計只是比較注重下面的幾個方法:struct file_operations ***_ops={.owner = THIS_MODULE,.llseek = ***_llseek,.read = ***_read,.write = ***_write,.ioctl = ***_ioctl,.open = ***_open,.release = ***_release, }; |