linux core dump 文件 gdb分析

core dump又叫核心轉儲, 當程序運行過程當中發生異常, 程序異常退出時, 由操做系統把程序當前的內存情況存儲在一個core文件中, 叫core dump. (linux中若是內存越界會收到SIGSEGV信號,而後就會core dump)html

在程序運行的過程當中,有的時候咱們會遇到Segment fault(段錯誤)這樣的錯誤。這種看起來比較困難,由於沒有任何的棧、trace信息輸出。該種類型的錯誤每每與指針操做相關。每每能夠經過這樣的方式進行定位。linux

一 形成segment fault,產生core dump的可能緣由shell

1.內存訪問越界編程

 a) 因爲使用錯誤的下標,致使數組訪問越界數組

 b) 搜索字符串時,依靠字符串結束符來判斷字符串是否結束,可是字符串沒有正常的使用結束符安全

 c) 使用strcpy, strcat, sprintf, strcmp, strcasecmp等字符串操做函數,將目標字符串讀/寫爆。應該使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函數防止讀寫越界。bash

2 多線程程序使用了線程不安全的函數。多線程

3 多線程讀寫的數據未加鎖保護。對於會被多個線程同時訪問的全局數據,應該注意加鎖保護,不然很容易形成core dump函數

4 非法指針工具

a) 使用空指針

b) 隨意使用指針轉換。一個指向一段內存的指針,除非肯定這段內存原先就分配爲某種結構或類型,或者這種結構或類型的數組,不然不要將它轉換爲這種結構或類型的指針,而應該將這段內存拷貝到一個這種結構或類型中,再訪問這個結構或類型。這是由於若是這段內存的開始地址不是按照這種結構或類型對齊的,那麼訪問它時就很容易由於bus error而core dump.

5 堆棧溢出.不要使用大的局部變量(由於局部變量都分配在棧上),這樣容易形成堆棧溢出,破壞系統的棧和堆結構,致使出現莫名其妙的錯誤。

二 配置操做系統使其產生core文件

首先經過ulimit命令查看一下系統是否配置支持了dump core的功能。經過ulimit -c或ulimit -a,能夠查看core file大小的配置狀況,若是爲0,則表示系統關閉了dump core。能夠經過ulimit -c unlimited來打開。若發生了段錯誤,但沒有core dump,是因爲系統禁止core文件的生成。

解決方法:
$ulimit -c unlimited  (只對當前shell進程有效)
或在~/.bashrc 的最後加入: ulimit -c unlimited (一勞永逸)

# ulimit -c

0

$ ulimit -a

core file size          (blocks, -c) 0

data seg size           (kbytes, -d) unlimited

file size               (blocks, -f) unlimited

三 用gdb查看core文件

發生core dump以後, 用gdb進行查看core文件的內容, 以定位文件中引起core dump的行.

gdb [exec file] [core file]

如: gdb ./test test.core

使用gdb 調試方法,首先要在gcc編譯時加入-g選項。

調試core文件,在Linux命令行下:gdb pname corefile。

例如,程序名爲controller_tester,core文件爲core.3421,則爲:gdb controller_tester core.3421。

這樣進入了gdb core調試模式。

追蹤產生segmenttation fault的位置及代碼函數調用狀況:

 

gdb>bt

這樣,通常就能夠看到出錯的代碼是哪一句了,還能夠打印出相應變量的數值,進行進一步分析。

gdb>print 變量名

以後,就全看各位本身的編程功力與經驗了,gdb已經作了不少了。

2. 對於結構複雜的程序,如涉及模板類及複雜的調用,gdb得出了出錯位置,彷佛這還不夠,這時候要使用更爲專業的工具——valgrind。

valgrind是一款專門用做內存調試,內存泄露檢測的開源工具軟件,valgrind這個名字取自北歐神話英靈殿的入口,不過,不能不認可,它確實是Linux下作內存調用分析的神器。通常Linux系統上應該沒有自帶valgrind,須要自行進行下載安裝。

下載地址:http://valgrind.org/downloads/current.html

進入下載文件夾,分別執行(須要root權限,且必須按默認路徑安裝,不然有加載錯誤):

./configure

make

make install

安裝成功後,使用相似以下命令啓動程序:

valgrind --tool=memcheck --leak-check=full --track-origins=yes --leak-resolution=high --show-reachable=yes --log-file=memchecklog ./controller_test

其中,–log-file=memchecklog指記錄日誌文件,名字爲memchecklog;–tool=memcheck和–leak-check=full用於內存檢測。

能夠獲得相似的記錄:

==23735==
==23735== Thread 1:
==23735== Invalid read of size 4
==23735== at 0x804F327: ResourceHandler<HBMessage>::~ResourceHandler() (ResourceHandler.cpp:48)
==23735== by 0x804FDBE: ConnectionManager<HBMessage>::~ConnectionManager() (ConnectionManager.cpp:74)
==23735== by 0×8057288: MainThread::~MainThread() (MainThread.cpp:73)
==23735== by 0x8077B2F: main (Main.cpp:177)
==23735== Address 0×0 is not stack’d, malloc’d or (recently) free’d
==23735==

能夠看到說明爲沒法訪問Address 0x0,明顯爲一處錯誤。

這樣valgrind直接給出了出錯緣由以及程序中全部的內存調用、釋放記錄,很是智能,在得知錯誤緣由的狀況下,找出錯誤就效率高多了。

再說一句,valgrind同時給出了程序的Memory Leak狀況的報告,給出了new-delete對應狀況,全部泄漏點位置給出,這一點在其餘工具很難作到,十分好用。

相關文章
相關標籤/搜索