Linux的最大的好處之一就是它的源碼公開。同時,公開的核心源碼也吸引着無數的電腦愛好者和程序員;他們把解讀和分析Linux的核心源碼做爲本身的最大興趣,把修改Linux源碼和改造Linux系統做爲本身對計算機技術追求的最大目標。linux
Linux內核源碼是很具吸引力的,特別是當你弄懂了一個分析了很久都沒搞懂的問題;或者是 被你修改過了的內核,順利經過編譯,一切運行正常的時候。那種成就感真是油然而生!並且,對內核的分析,除了出自對技術的狂熱追求以外,這種使人生畏的勞 動所帶來的回報也是很是使人着迷的,這也正是它擁有衆多追隨者的主要緣由:程序員
首先,你能夠從中學到不少的計算機的底層知識,如後面將講到的系統的引導和硬件提供的中斷機制等;其它,象虛擬存儲的實現機制,多任務機制,系統保護機制等等,這些都是非都源碼不能體會的。編程
同時,你還將從操做系統的總體結構中,體會總體設計在軟件設計中的分量和做用,以及一些宏觀設計的方法和技巧:Linux的內核爲上層應用提供一個 與具體硬件不相關的平臺;同時在內核內部,它又把代碼分爲與體系結構和硬件相關的部分,和可移植的部分;再例如,Linux雖然不是微內核的,但他把大部 分的設備驅動處理成相對獨立的內核模塊,這樣減少了內核運行的開銷,加強了內核代碼的模塊獨立性。網絡
並且你還能從對內核源碼的分析中,體會到它在解決某個具體細節問題時,方法的巧妙:如後面將分析到了的Linux經過Botoom_half機制來加快系統對中斷的處理。ide
最重要的是:在源碼的分析過程當中,你將會被一點一點地、潛移默化地專業化。一個專業 的程序員,老是把代碼的清晰性,兼容性,可移植性放在很重要的位置。他們老是經過定義大量的宏,來加強代碼的清晰度和可讀性,而又不增長編譯後的代碼長度 和代碼的運行效率;他們老是在編碼的同時,就考慮到了之後的代碼維護和升級。 甚至,只要分析百分之一的代碼後,你就會深入地體會到,什麼樣的代碼纔是一個專業的程序員寫的,什麼樣的代碼是一個業餘愛好者寫的。而這一點是任何沒有真 正分析過標準代碼的人都沒法體會到的。函數
然而,因爲內核代碼的冗長,和內核體系結構的龐雜,因此分析內核也是一個很艱難,很須要毅力的事;在缺少指導和交流的狀況下,尤爲如此。只有方法正確,才能事半功倍。正是基於這種考慮,做者但願經過此文能給你們一些借鑑和啓迪。工具
因爲本人所進行的分析都是基於2.2.5版本的內核;因此,若是沒有特別說明,如下分析都是基於i386單處理器的2.2.5版本的Linux內核。全部源文件均是相對於目錄/usr/src/linux的。源碼分析
方法之一:從何入手編碼
要分析Linux內核源碼,首先必須找到各個模塊的位置,也即要弄懂源碼的文件組織形式。雖然對於有經驗的高手而言,這個不是很難;但對於不少初級的Linux愛好者,和那些對源碼分析頗有興趣但接觸很少的人來講,這仍是頗有必要的。操作系統
一、Linux核心源程序一般都安裝在/usr/src/linux下,並且它有一個很是簡單的編號約定:任何偶數的核心(的二個數爲偶數,例如2.0.30)都是一個穩定地發行的核心,而任何奇數的核心(例如2.1.42)都是一個開發中的核心。
二、核心源程序的文件按樹形結構進行組織,在源程序樹的最上層,即目錄/usr/src/linux下有這樣一些目錄和文件:
◆ COPYING: GPL版權申明。對具備GPL版權的源代碼改動而造成的程序,或使用GPL工具產生的程序,具備使用GPL發表的義務,如公開源代碼;
◆ CREDITS: 光榮榜。對Linux作出過很大貢獻的一些人的信息;
◆ MAINTAINERS: 維護人員列表,對當前版本的內核各部分都有誰負責;
◆ Makefile: 第一個Makefile文件。用來組織內核的各模塊,記錄了個模塊間的相互這間的聯繫和依託關係,編譯時使用;仔細閱讀各子目錄下的Makefile文件對弄清各個文件這間的聯繫和依託關係頗有幫助;
◆ ReadMe: 核心及其編譯配置方法簡單介紹;
◆ Rules.make: 各類Makefilemake所使用的一些共同規則;
◆ REPORTING-BUGS:有關報告Bug 的一些內容;
● Arch/ :arch子目錄包括了全部和體系結構相關的核心代碼。它的每個子目錄都表明一種支持的體系結構,例如i386就是關於intel CPU及與之相兼容體系結構的子目錄。PC機通常都基於此目錄;
● Include/: include子目錄包括編譯核心所須要的大部分頭文件。與平臺無關的頭文件在 include/linux子目錄下,與 intel cpu相關的頭文件在include/asm-i386子目錄下,而include/scsi目錄則是有關scsi設備的頭文件目錄;
● Init/: 這個目錄包含核心的初始化代碼(注:不是系統的引導代碼),包含兩個文件main.c和Version.c,這是研究核心如何工做的好的起點之一。
● Mm/:這個目錄包括全部獨立於 cpu 體系結構的內存管理代碼,如頁式存儲管理內存的分配和釋放等;而和體系結構相關的內存管理代碼則位於arch/*/mm/,例如arch/i386/mm/Fault.c;
● Kernel/:主要的核心代碼,此目錄下的文件實現了大多數linux系統的內核函數,其中最重要的文件當屬sched.c;一樣,和體系結構相關的代碼在arch/*/kernel中;
● Drivers/: 放置系統全部的設備驅動程序;每種驅動程序又各佔用一個子目錄:如,/block 下爲塊設備驅動程序,好比ide(ide.c)。若是你但願查看全部可能包含文件系統的設備是如何初始化的,你能夠看drivers/block /genhd.c中的device_setup()。它不只初始化硬盤,也初始化網絡,由於安裝nfs文件系統的時候須要網絡;
● Documentation/: 文檔目錄,沒有內核代碼,只是一套有用的文檔,惋惜都是English的,看看應該有用的哦;
● Fs/: 全部的文件系統代碼和各類類型的文件操做代碼,它的每個子目錄支持一個文件系統, 例如fat和ext2;
● Ipc/: 這個目錄包含核心的進程間通信的代碼;
● Lib/: 放置核心的庫代碼;
● Net/: 核心與網絡相關的代碼;
● Modules/: 模塊文件目錄,是個空目錄,用於存放編譯時產生的模塊目標文件;
● Scripts/: 描述文件,腳本,用於對核心的配置;
通常,在每一個子目錄下,都有一個 Makefile 和一個Readme 文件,仔細閱讀這兩個文件,對內核源碼的理解頗有用。
對Linux內核源碼的分析,有幾個很好的入口點:一個就是系統的引導和初始化,即 從機器加電到系統核心的運行;另一個就是系統調用,系統調用是用戶程序或操做調用核心所提供的功能的接口。對於那些對硬件比較熟悉的愛好者,從系統的引 導入手進行分析,可能來的容易一些;而從系統調用下口,則可能更合適於那些在dos或Uinx、Linux下有過C編程經驗的高手。