您能夠用各類方法來監控運行着的用戶空間程序:能夠爲其運行調試器並單步調試該程序,添加打印語句,或者添加工具來分析程序。本文描述了幾種能夠用來調試在 Linux 上運行的程序的方法。咱們將回顧四種調試問題的狀況,這些問題包括段錯誤,內存溢出和泄漏,還有掛起。
本文討論了四種調試 Linux 程序的狀況。在第 1 種狀況中,咱們使用了兩個有內存分配問題的樣本程序,使用 MEMWATCH 和 Yet Another Malloc Debugger(YAMD)工具來調試它們。在第 2 種狀況中,咱們使用了 Linux 中的 strace 實用程序,它可以跟蹤系統調用和信號,從而找出程序發生錯誤的地方。在第 3 種狀況中,咱們使用 Linux 內核的 Oops 功能來解決程序的段錯誤,並向您展現如何設置內核源代碼級調試器(kernel source level debugger,kgdb),以使用 GNU 調試器(GNU debugger,gdb)來解決相同的問題;kgdb 程序是使用串行鏈接的 Linux 內核遠程 gdb。在第 4 種狀況中,咱們使用 Linux 上提供的魔術鍵控順序(magic key sequence)來顯示引起掛起問題的組件的信息。html
常見調試方法
當您的程序中包含錯誤時,極可能在代碼中某處有一個條件,您認爲它爲真(true),但其實是假(false)。找出錯誤的過程也就是在找出錯誤後推翻之前一直確信爲真的某個條件過程。linux
如下幾個示例是您可能確信成立的條件的一些類型:編程
在源代碼中的某處,某變量有特定的值。
在給定的地方,某個結構已被正確設置。
對於給定的 if-then-else 語句,if 部分就是被執行的路徑。
當子例程被調用時,該例程正確地接收到了它的參數。小程序
找出錯誤也就是要肯定上述全部狀況是否存在。若是您確信在子例程被調用時某變量應該有特定的值,那麼就檢查一下狀況是否如此。若是您相信 if 結構會被執行,那麼也檢查一下狀況是否如此。一般,您的假設都會是正確的,但最終您會找到與假設不符的狀況。結果,您就會找出發生錯誤的地方。數組
調試是您沒法逃避的任務。進行調試有不少種方法,好比將消息打印到屏幕上、使用調試器,或只是考慮程序執行的狀況並仔細地揣摩問題所在。app
在修正問題以前,您必須找出它的源頭。舉例來講,對於段錯誤,您須要瞭解段錯誤發生在代碼的哪一行。一旦您發現了代碼中出錯的行,請肯定該方法中變量的值、方法被調用的方式以及關於錯誤如何發生的詳細狀況。使用調試器將使找出全部這些信息變得很簡單。若是沒有調試器可用,您還可使用其它的工具。(請注意,產品環境中可能並不提供調試器,並且 Linux 內核沒有內建的調試器。)編程語言
實用的內存和內核工具
您可使用 Linux 上的調試工具,經過各類方式跟蹤用戶空間和內核問題。請使用下面的工具和技術來構建和調試您的源代碼:
用戶空間工具:函數
內存工具:MEMWATCH 和 YAMD
strace
GNU 調試器(gdb)
魔術鍵控順序工具
內核工具:post
內核源代碼級調試器(kgdb)
內建內核調試器(kdb)
Oops
本文將討論一類經過人工檢查代碼不容易找到的問題,並且此類問題只在不多見的狀況下存在。內存錯誤一般在多種狀況同時存在時出現,並且您有時只能在部署程序以後才能發現內存錯誤。
第 1 種狀況:內存調試工具
C 語言做爲 Linux 系統上標準的編程語言給予了咱們對動態內存分配很大的控制權。然而,這種自由可能會致使嚴重的內存管理問題,而這些問題可能致使程序崩潰或隨時間的推移致使性能降級。
內存泄漏(即 malloc() 內存在對應的 free() 調用執行後永不被釋放)和緩衝區溢出(例如對之前分配到某數組的內存進行寫操做)是一些常見的問題,它們可能很難檢測到。這一部分將討論幾個調試工具,它們極大地簡化了檢測和找出內存問題的過程。
MEMWATCH
MEMWATCH 由 Johan Lindh 編寫,是一個開放源代碼 C 語言內存錯誤檢測工具,您能夠本身下載它(請參閱本文後面部分的參考資料)。只要在代碼中添加一個頭文件並在 gcc 語句中定義了 MEMWATCH 以後,您就能夠跟蹤程序中的內存泄漏和錯誤了。MEMWATCH 支持 ANSI C,它提供結果日誌紀錄,能檢測雙重釋放(double-free)、錯誤釋放(erroneous free)、沒有釋放的內存(unfreed memory)、溢出和下溢等等。
清單 1. 內存樣本(test1.c)
代碼:
#include
#include
#include "memwatch.h"
int main(void)
{
char *ptr1;
char *ptr2;
ptr1 = malloc(512);
ptr2 = malloc(512);
ptr2 = ptr1;
free(ptr2);
free(ptr1);
}
清單 1 中的代碼將分配兩個 512 字節的內存塊,而後指向第一個內存塊的指針被設定爲指向第二個內存塊。結果,第二個內存塊的地址丟失,從而產生了內存泄漏。
如今咱們編譯清單 1 的 memwatch.c。下面是一個 makefile 示例:
test1
gcc -DMEMWATCH -DMW_STDIO test1.c memwatch
c -o test1
當您運行 test1 程序後,它會生成一個關於泄漏的內存的報告。清單 2 展現了示例 memwatch.log 輸出文件。
清單 2. test1 memwatch.log 文件
MEMWATCH 2.67 Copyright (C) 1992-1999 Johan Lindh
...
double-free: <4> test1.c(15), 0x80517b4 was freed from test1.c(14)
...
unfreed: <2> test1.c(11), 512 bytes at 0x80519e4
{FE FE FE FE FE FE FE FE FE FE FE FE ..............}
Memory usage statistics (global):
N)umber of allocations made: 2
L)argest memory usage : 1024
T)otal of all alloc() calls: 1024
U)nfreed bytes totals : 512
MEMWATCH 爲您顯示真正致使問題的行。若是您釋放一個已經釋放過的指針,它會告訴您。對於沒有釋放的內存也同樣。日誌結尾部分顯示統計信息,包括泄漏了多少內存,使用了多少內存,以及總共分配了多少內存。
YAMD
YAMD 軟件包由 Nate Eldredge 編寫,能夠查找 C 和 C++ 中動態的、與內存分配有關的問題。在撰寫本文時,YAMD 的最新版本爲 0.32。請下載 yamd-0.32.tar.gz(請參閱參考資料)。執行 make 命令來構建程序;而後執行 make install 命令安裝程序並設置工具。
一旦您下載了 YAMD 以後,請在 test1.c 上使用它。請刪除 #include memwatch.h 並對 makefile 進行以下小小的修改:
使用 YAMD 的 test1
gcc -g test1.c -o test1
清單 3 展現了來自 test1 上的 YAMD 的輸出。
清單 3. 使用 YAMD 的 test1 輸出
YAMD version 0.32
Executable: /usr/src/test/yamd-0.32/test1
...
INFO: Normal allocation of this block
Address 0x40025e00, size 512
...
INFO: Normal allocation of this block
Address 0x40028e00, size 512
...
INFO: Normal deallocation of this block
Address 0x40025e00, size 512
...
ERROR: Multiple freeing At
free of pointer already freed
Address 0x40025e00, size 512
...
WARNING: Memory leak
Address 0x40028e00, size 512
WARNING: Total memory leaks:
1 unfreed allocations totaling 512 bytes
*** Finished at Tue ... 10:07:15 2002
Allocated a grand total of 1024 bytes 2 allocations
Average of 512 bytes per allocation
Max bytes allocated at one time: 1024
24 K alloced internally / 12 K mapped now / 8 K max
Virtual program size is 1416 K
End.
YAMD 顯示咱們已經釋放了內存,並且存在內存泄漏。讓咱們在清單 4 中另外一個樣本程序上試試 YAMD。
清單 4. 內存代碼(test2.c)
代碼:
#include
#include
int main(void)
{
char *ptr1;
char *ptr2;
char *chptr;
int i = 1;
ptr1 = malloc(512);
ptr2 = malloc(512);
chptr = (char *)malloc(512);
for (i; i <= 512; i++) {
chptr[i] = 'S';
}
ptr2 = ptr1;
free(ptr2);
free(ptr1);
free(chptr);
}
您可使用下面的命令來啓動 YAMD:
./run-yamd /usr/src/test/test2/test2
清單 5 顯示了在樣本程序 test2 上使用 YAMD 獲得的輸出。YAMD 告訴咱們在 for 循環中有「越界(out-of-bounds)」的狀況。
清單 5. 使用 YAMD 的 test2 輸出
Running /usr/src/test/test2/test2
Temp output to /tmp/yamd-out.1243
*********
./run-yamd: line 101: 1248 Segmentation fault (core dumped)
YAMD version 0.32
Starting run: /usr/src/test/test2/test2
Executable: /usr/src/test/test2/test2
Virtual program size is 1380 K
...
INFO: Normal allocation of this block
Address 0x40025e00, size 512
...
INFO: Normal allocation of this block
Address 0x40028e00, size 512
...
INFO: Normal allocation of this block
Address 0x4002be00, size 512
ERROR: Crash
...
Tried to write address 0x4002c000
Seems to be part of this block:
Address 0x4002be00, size 512
...
Address in question is at offset 512 (out of bounds)
Will dump core after checking heap.
Done.
MEMWATCH 和 YAMD 都是頗有用的調試工具,它們的使用方法有所不一樣。對於 MEMWATCH,您須要添加包含文件 memwatch.h 並打開兩個編譯時間標記。對於連接(link)語句,YAMD 只須要 -g 選項。
Electric Fence
多數 Linux 分發版包含一個 Electric Fence 包,不過您也能夠選擇下載它。Electric Fence 是一個由 Bruce Perens 編寫的 malloc() 調試庫。它就在您分配內存後分配受保護的內存。若是存在 fencepost 錯誤(超過數組末尾運行),程序就會產生保護錯誤,並當即結束。經過結合 Electric Fence 和 gdb,您能夠精確地跟蹤到哪一行試圖訪問受保護內存。Electric Fence 的另外一個功能就是可以檢測內存泄漏。
第 2 種狀況:使用 strace
strace 命令是一種強大的工具,它可以顯示全部由用戶空間程序發出的系統調用。strace 顯示這些調用的參數並返回符號形式的值。strace 從內核接收信息,並且不須要以任何特殊的方式來構建內核。將跟蹤信息發送到應用程序及內核開發者都頗有用。在清單 6 中,分區的一種格式有錯誤,清單顯示了 strace 的開頭部分,內容是關於調出建立文件系統操做(mkfs)的。strace 肯定哪一個調用致使問題出現。
清單 6. mkfs 上 strace 的開頭部分
execve("/sbin/mkfs.jfs", ["mkfs.jfs", "-f", "/dev/test1"], &
...
open("/dev/test1", O_RDWR|O_LARGEFILE) = 4
stat64("/dev/test1", {st_mode=&, st_rdev=makedev(63, 255), ...}) = 0
ioctl(4, 0x40041271, 0xbfffe128) = -1 EINVAL (Invalid argument)
write(2, "mkfs.jfs: warning - cannot setb" ..., 98mkfs.jfs: warning -
cannot set blocksize on block device /dev/test1: Invalid argument )
= 98
stat64("/dev/test1", {st_mode=&, st_rdev=makedev(63, 255), ...}) = 0
open("/dev/test1", O_RDONLY|O_LARGEFILE) = 5
ioctl(5, 0x80041272, 0xbfffe124) = -1 EINVAL (Invalid argument)
write(2, "mkfs.jfs: can\'t determine device"..., ..._exit(1)
= ?
清單 6 顯示 ioctl 調用致使用來格式化分區的 mkfs 程序失敗。ioctl BLKGETSIZE64 失敗。(BLKGET-SIZE64 在調用 ioctl 的源代碼中定義。) BLKGETSIZE64 ioctl 將被添加到 Linux 中全部的設備,而在這裏,邏輯卷管理器還不支持它。所以,若是 BLKGETSIZE64 ioctl 調用失敗,mkfs 代碼將改成調用較早的 ioctl 調用;這使得 mkfs 適用於邏輯卷管理器。
1:調試函數的一系列命令,源代碼以下main.c
#include <stdio.h>
int add_range(int low, int high)
{
int i,sum;
for(i=low;i<=high;i++)
sum=sum+i;
return sum;
}
int main(void)
{
int result[100];
result[0]=add_range(1,10);
result[1]=add_range(1,100);
printf("result[0]=%d\nresult[1]=%d\n",result[0],result[1]);
return 0;
}
結果爲55 5015 與正確結果不一樣,調試以下
1步驟: gcc -g main.c -o main linux下c源文件編譯(含有源代碼,能夠調試):gdb main 進入main函數的調試help幫助l 1或者 l main 查看源代碼start開始調試n(next)下一步s(step)跳進函數bt(backtrace)查看函數調用的棧幀i(info) locals 查看方法的局部變量f(frame) 1 選擇1號棧幀i locals 查看1號棧幀的局部變量,即main函數的局部變量p(print) sum 查看sum變量的值finish 跳出當前函數,回到main函數set var sum=0 修改變量sum的值爲0p(print) result[2]=33 print也能夠像set同樣設置變量的值2int main(){int sum=0,i=0;char input[5];while(1){scanf("%s",input);for(i=0;input[i]!='\0';i++)sum=sum*10+input[i]-'0';printf("input=%d\n",sum);}return 0;}第一次輸入123正確,第二次錯誤調試命令以下:start 啓動調試display sum 每次定下來都顯示sum的值undisplay 取消對這個變量的跟蹤b(break) 9 在第9行設置一個斷點 參數也能夠是函數名c(continue) 表示連續運行,跳到下一個斷點i breakpoints 顯示已經設置的斷點delete breakpoints 2 刪除斷點2delete breakpoints 刪除全部的斷點disable breakpoints 3 使某個斷點失效break 9 if sum != 0 知足條件纔可使用該斷點r 從新從程序開始連續執行x 命令打印存儲器中的內容 x/7b input 7b是打印格式,b表示每一個字節一組,7表示打印7組watch input[5] 跟蹤某變量