本文適用於CentOS 6.4, CentOS 6.5,估計也適用於其餘Linux發行版。html
[root@hostname ~]# uname -r 2.6.32-220.el6.x86_64 [root@hostname ~]# cat /etc/centos-release CentOS release 6.5 (Final)
編譯安裝新內核,依賴於開發環境和開發庫linux
# yum grouplist //查看已經安裝的和未安裝的軟件包組,來判斷咱們是否安裝了相應的開發環境和開發庫; # yum groupinstall "Development Tools" //通常是安裝這兩個軟件包組,這樣作會肯定你擁有編譯時所需的一切工具 # yum install ncurses-devel //你必須這樣才能讓 make *config 這個指令正確地執行 # yum install qt-devel //若是你沒有 X 環境,這一條能夠不用 # yum install hmaccalc zlib-devel binutils-devel elfutils-libelf-devel //建立 CentOS-6 內核時須要它們
若是當初安裝系統是選擇了Software workstation,上面的安裝包幾乎都已包含。git
Linux內核版本有兩種:穩定版和開發版 ,Linux內核版本號由3個數字組成:r.x.ygithub
去 http://www.kernel.org 首頁,能夠看到有stable, longterm等版本,longterm是比stable更穩定的版本,會長時間更新,所以我選擇 3.10.58。docker
wget https://www.kernel.org/pub/linux/kernel/v3.x/linux-3.10.28.tar.xz[root@sean ~]#
[root@sean ~]# tar -xf linux-3.10.58.tar.xz -C /usr/src/ [root@sean ~]# cd /usr/src/linux-3.10.58/ [root@sean linux-3.10.58]# cp /boot/config-2.6.32-220.el6.x86_64 .config
咱們在系統原有的內核配置文件的基礎上創建新的編譯選項,因此複製一份到當前目錄下,命名爲.config。接下來繼續配置:segmentfault
[root@sean linux-3.10.58]# sh -c 'yes "" | make oldconfig' HOSTCC scripts/basic/fixdep HOSTCC scripts/kconfig/conf.o SHIPPED scripts/kconfig/zconf.tab.c SHIPPED scripts/kconfig/zconf.lex.c SHIPPED scripts/kconfig/zconf.hash.c HOSTCC scripts/kconfig/zconf.tab.o HOSTLD scripts/kconfig/conf scripts/kconfig/conf --oldconfig Kconfig .config:555:warning: symbol value 'm' invalid for PCCARD_NONSTATIC .config:2567:warning: symbol value 'm' invalid for MFD_WM8400 .config:2568:warning: symbol value 'm' invalid for MFD_WM831X .config:2569:warning: symbol value 'm' invalid for MFD_WM8350 .config:2582:warning: symbol value 'm' invalid for MFD_WM8350_I2C .config:2584:warning: symbol value 'm' invalid for AB3100_CORE .config:3502:warning: symbol value 'm' invalid for MMC_RICOH_MMC * * Restart config... * * * General setup * ... ... XZ decompressor tester (XZ_DEC_TEST) [N/m/y/?] (NEW) Averaging functions (AVERAGE) [Y/?] (NEW) y CORDIC algorithm (CORDIC) [N/m/y/?] (NEW) JEDEC DDR data (DDR) [N/y/?] (NEW) # # configuration written to .config
make oldconfig
會讀取當前目錄下的.config
文件,在.config
文件裏沒有找到的選項則提示用戶填寫,而後備份.config
文件爲.config.old
,並生成新的.config
文件,參考http://stackoverflow.com/questions/4178526/what-does-make-oldconfig-do-exactly-linux-kernel-makefilecentos
有的文檔裏介紹使用make memuconfig,它即是根據須要定製模塊,相似界面以下:(在此不須要)
ruby
[root@sean linux-3.10.58]# make -j4 bzImage //生成內核文件 [root@sean linux-3.10.58]# make -j4 modules //編譯模塊 [root@sean linux-3.10.58]# make -j4 modules_install //編譯安裝模塊
-j後面的數字是線程數,用於加快編譯速度,通常的經驗是,邏輯CPU,就填寫那個數字,例若有8核,則爲-j8。(modules部分耗時30多分鐘)bash
[root@sean linux-3.10.58]# make install
實際運行到這一步時,出現ERROR: modinfo: could not find module vmware_balloon
,可是不影響內核安裝,是因爲vsphere須要的模塊沒有編譯,要避免這個問題,須要在make以前時修改.config文件,加入
HYPERVISOR_GUEST=yCONFIG_VMWARE_BALLOON=m
(這一部分比較容易出問題,參考下文異常部分)服務器
安裝完成後,須要修改Grub引導順序,讓新安裝的內核做爲默認內核。
編輯 grub.conf文件,
vi /etc/grub.conf
#boot=/dev/sda default=0 timeout=5 splashimage=(hd0,0)/grub/splash.xpm.gz hiddenmenu title CentOS (3.10.58) root (hd0,0) ...
數一下剛剛新安裝的內核在哪一個位置,從0開始,而後設置default爲那個數字,通常新安裝的內核在第一個位置,因此設置default=0。
重啓reboot
:
[root@sean ~]# uname -r 3.10.58
升級內核成功!
能夠先清除,再從新編譯:
# make mrproper #完成或者安裝過程出錯,能夠清理上次編譯的現場 # make clean
[root@sean linux-3.10.58]# make install sh /usr/src/linux-3.10.58/arch/x86/boot/install.sh 3.10.58 arch/x86/boot/bzImage \ System.map "/boot" ERROR: modinfo: could not find module vmware_balloon
能夠忽略,若是你有強迫症的話,嘗試如下辦法:
要在vmware上須要安裝VMWARE_BALLOON,可直接修改.config文件,但若是vi直接加入CONFIG_VMWARE_BALLOON=m
依然是沒有效果的,由於它依賴於HYPERVISOR_GUEST=y
。若是你不知道這層依賴關係,經過make menuconfig
後,Device Drivers -> MISC devices 下是找不到VMware Balloon Driver的。(手動vi .config修改HYPERVISOR_GUEST後,即可以找到這一項),另外,不管是經過make menuconfig或直接vi .config,最後都要運行sh -c 'yes "" | make oldconfig'
一次獲得最終的編譯配置選項。
而後,考慮到vmware_balloon可能在這個版本里已改名爲vmw_balloon,經過下面的方法保險起見:
# cd /lib/modules/3.10.58/kernel/drivers/misc/ # ln -s vmw_balloon.ko vmware_balloon.ko #創建軟鏈接
其實,針對安裝docker的內核編譯環境,最明智的選擇是使用sciurus幫咱們配置好的.config文件。
也建議在make bzImage
以前,運行腳本check-config.sh檢查當前內核運行docker所缺失的模塊。
當提示缺乏其餘module時如NF_NAT_IPV4時,也能夠經過上面的方法解決,而後從新編譯。
在網絡中,很多服務器採用的是Linux系統。爲了進一步提升服務器的性能,可能須要根據特定的硬件及需求從新編譯Linux內核。編譯Linux內核,須要根據規定的步驟進行,編譯內核過程當中涉及到幾個重要的文件。好比對於RedHat Linux,在/boot目錄下有一些與Linux內核有關的文件,進入/boot執行:ls –l。編譯過RedHat Linux內核的人對其中的System.map 、vmlinuz、initrd-2.4.7-10.img印象可能比較深入,由於編譯內核過程當中涉及到這些文件的創建等操做。那麼這幾個文件是怎麼產生的?又有什麼做用呢?
vmlinuz是可引導的、壓縮的內核。「vm」表明「Virtual Memory」。Linux 支持虛擬內存,不像老的操做系統好比DOS有640KB內存的限制。Linux可以使用硬盤空間做爲虛擬內存,所以得名「vm」。vmlinuz是可執行的Linux內核,它位於/boot/vmlinuz,它通常是一個軟連接。
vmlinuz的創建有兩種方式。
一是編譯內核時經過「make zImage」建立,而後經過:「cp /usr/src/linux-2.4/arch/i386/linux/boot/zImage /boot/vmlinuz」產生。zImage適用於小內核的狀況,它的存在是爲了向後的兼容性。
二是內核編譯時經過命令make bzImage建立,而後經過:「cp /usr/src/linux-2.4/arch/i386/linux/boot/bzImage /boot/vmlinuz」產生。
bzImage是壓縮的內核映像,須要注意,bzImage不是用bzip2壓縮的,bzImage中的bz容易引發誤解,bz表示「big zImage」。 bzImage中的b是「big」意思。
zImage(vmlinuz)和bzImage(vmlinuz)都是用gzip壓縮的。它們不只是一個壓縮文件,並且在這兩個文件的開頭部份內嵌有gzip解壓縮代碼。因此你不能用gunzip 或 gzip –dc解包vmlinuz。
內核文件中包含一個微型的gzip用於解壓縮內核並引導它。二者的不一樣之處在於,老的zImage解壓縮內核到低端內存(第一個640K),bzImage解壓縮內核到高端內存(1M以上)。若是內核比較小,那麼能夠採用zImage 或bzImage之一,兩種方式引導的系統運行時是相同的。大的內核採用bzImage,不能採用zImage。
vmlinux是未壓縮的內核,vmlinuz是vmlinux的壓縮文件。
(2) initrd-x.x.x.img
initrd是「initial ramdisk」的簡寫。initrd通常被用來臨時的引導硬件到實際內核vmlinuz可以接管並繼續引導的狀態。好比,使用的是scsi硬盤,而內核vmlinuz中並無這個scsi硬件的驅動,那麼在裝入scsi模塊以前,內核不能加載根文件系統,但scsi模塊存儲在根文件系統的/lib/modules下。爲了解決這個問題,能夠引導一個可以讀實際內核的initrd內核並用initrd修正scsi引導問題。initrd-2.4.7-10.img是用gzip壓縮的文件,下面來看一看這個文件的內容。
initrd實現加載一些模塊和安裝文件系統等。
initrd映象文件是使用mkinitrd建立的。mkinitrd實用程序可以建立initrd映象文件。這個命令是RedHat專有的。其它Linux發行版或許有相應的命令。這是個很方便的實用程序。具體狀況請看幫助:man mkinitrd
下面的命令建立initrd映象文件:
(3) System.map
System.map是一個特定內核的內核符號表。它是你當前運行的內核的System.map的連接。
內核符號表是怎麼建立的呢? System.map是由「nm vmlinux」產生而且不相關的符號被濾出。對於本文中的例子,編譯內核時,System.map建立在/usr/src/linux-2.4/System.map。像下面這樣:
nm /boot/vmlinux-2.4.7-10 > System.map
下面幾行來自/usr/src/linux-2.4/Makefile:
nm vmlinux | grep -v '(compiled)|(.o
)|(LASH[RL]DI)' | sort > System.map
而後複製到/boot:
cp /usr/src/linux/System.map /boot/System.map-2.4.7-10
在進行程序設計時,會命名一些變量名或函數名之類的符號。Linux內核是一個很複雜的代碼塊,有許許多多的全局符號。
Linux內核不使用符號名,而是經過變量或函數的地址來識別變量或函數名。好比不是使用size_t BytesRead這樣的符號,而是像c0343f20這樣引用這個變量。
對於使用計算機的人來講,更喜歡使用那些像size_t BytesRead這樣的名字,而不喜歡像c0343f20這樣的名字。內核主要是用c寫的,因此編譯器/鏈接器容許咱們編碼時使用符號名,當內核運行時使用地址。
然而,在有的狀況下,咱們須要知道符號的地址,或者須要知道地址對應的符號。這由符號表來完成,符號表是全部符號連同它們的地址的列表。Linux 符號表使用到2個文件:/proc/ksyms和System.map。
/proc/ksyms是一個「proc file」,在內核引導時建立。實際上,它並不真正的是一個文件,它只不過是內核數據的表示,卻給人們是一個磁盤文件的假象,這從它的文件大小是0能夠看出來。然而,System.map是存在於你的文件系統上的實際文件。當你編譯一個新內核時,各個符號名的地址要發生變化,你的老的System.map具備的是錯誤的符號信息。每次內核編譯時產生一個新的System.map,你應當用新的System.map來取代老的System.map。
雖然內核自己並不真正使用System.map,但其它程序好比klogd, lsof和ps等軟件須要一個正確的System.map。若是你使用錯誤的或沒有System.map,klogd的輸出將是不可靠的,這對於排除程序故障會帶來困難。沒有System.map,你可能會面臨一些使人煩惱的提示信息。
另外少數驅動須要System.map來解析符號,沒有爲你當前運行的特定內核建立的System.map它們就不能正常工做。
Linux的內核日誌守護進程klogd爲了執行名稱-地址解析,klogd須要使用System.map。System.map應當放在使用它的軟件可以找到它的地方。執行:man klogd可知,若是沒有將System.map做爲一個變量的位置給klogd,那麼它將按照下面的順序,在三個地方查找System.map:
/boot/System.map
/System.map
/usr/src/linux/System.map
System.map也有版本信息,klogd可以智能地查找正確的映象(map)文件。