core dump又叫核心轉儲, 當程序運行過程當中發生異常, 程序異常退出時, 由操做系統把程序當前的內存情況存儲在一個core文件中, 叫core dump. (linux中若是內存越界會收到SIGSEGV信號,而後就會core dump)html
在程序運行的過程當中,有的時候咱們會遇到Segment fault(段錯誤)這樣的錯誤。這種看起來比較困難,由於沒有任何的棧、trace信息輸出。該種類型的錯誤每每與指針操做相關。每每能夠經過這樣的方式進行定位。linux
一 形成segment fault,產生core dump的可能緣由shell
1.內存訪問越界編程
a) 因爲使用錯誤的下標,致使數組訪問越界數組
b) 搜索字符串時,依靠字符串結束符來判斷字符串是否結束,可是字符串沒有正常的使用結束符安全
c) 使用strcpy, strcat, sprintf, strcmp, strcasecmp等字符串操做函數,將目標字符串讀/寫爆。應該使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函數防止讀寫越界。bash
2 多線程程序使用了線程不安全的函數。多線程
3 多線程讀寫的數據未加鎖保護。對於會被多個線程同時訪問的全局數據,應該注意加鎖保護,不然很容易形成core dump函數
4 非法指針工具
a) 使用空指針
b) 隨意使用指針轉換。一個指向一段內存的指針,除非肯定這段內存原先就分配爲某種結構或類型,或者這種結構或類型的數組,不然不要將它轉換爲這種結構或類型的指針,而應該將這段內存拷貝到一個這種結構或類型中,再訪問這個結構或類型。這是由於若是這段內存的開始地址不是按照這種結構或類型對齊的,那麼訪問它時就很容易由於bus error而core dump.
5 堆棧溢出.不要使用大的局部變量(由於局部變量都分配在棧上),這樣容易形成堆棧溢出,破壞系統的棧和堆結構,致使出現莫名其妙的錯誤。
二 配置操做系統使其產生core文件
首先經過ulimit命令查看一下系統是否配置支持了dump core的功能。經過ulimit -c或ulimit -a,能夠查看core file大小的配置狀況,若是爲0,則表示系統關閉了dump core。能夠經過ulimit -c unlimited來打開。若發生了段錯誤,但沒有core dump,是因爲系統禁止core文件的生成。
解決方法:
$ulimit -c unlimited (只對當前shell進程有效)
或在~/.bashrc 的最後加入: ulimit -c unlimited (一勞永逸)
# ulimit -c
0
$ ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
file size (blocks, -f) unlimited
三 用gdb查看core文件
發生core dump以後, 用gdb進行查看core文件的內容, 以定位文件中引起core dump的行.
gdb [exec file] [core file]
如: gdb ./test test.core
使用gdb 調試方法,首先要在gcc編譯時加入-g選項。
調試core文件,在Linux命令行下:gdb pname corefile。
例如,程序名爲controller_tester,core文件爲core.3421,則爲:gdb controller_tester core.3421。
這樣進入了gdb core調試模式。
追蹤產生segmenttation fault的位置及代碼函數調用狀況:
gdb>bt
這樣,通常就能夠看到出錯的代碼是哪一句了,還能夠打印出相應變量的數值,進行進一步分析。
gdb>print 變量名
以後,就全看各位本身的編程功力與經驗了,gdb已經作了不少了。
2. 對於結構複雜的程序,如涉及模板類及複雜的調用,gdb得出了出錯位置,彷佛這還不夠,這時候要使用更爲專業的工具——valgrind。
valgrind是一款專門用做內存調試,內存泄露檢測的開源工具軟件,valgrind這個名字取自北歐神話英靈殿的入口,不過,不能不認可,它確實是Linux下作內存調用分析的神器。通常Linux系統上應該沒有自帶valgrind,須要自行進行下載安裝。
下載地址:http://valgrind.org/downloads/current.html
進入下載文件夾,分別執行(須要root權限,且必須按默認路徑安裝,不然有加載錯誤):
./configure
make
make install
安裝成功後,使用相似以下命令啓動程序:
valgrind --tool=memcheck --leak-check=full --track-origins=yes --leak-resolution=high --show-reachable=yes --log-file=memchecklog ./controller_test
其中,–log-file=memchecklog指記錄日誌文件,名字爲memchecklog;–tool=memcheck和–leak-check=full用於內存檢測。
能夠獲得相似的記錄:
==23735==
==23735== Thread 1:
==23735== Invalid read of size 4
==23735== at 0x804F327: ResourceHandler<HBMessage>::~ResourceHandler() (ResourceHandler.cpp:48)
==23735== by 0x804FDBE: ConnectionManager<HBMessage>::~ConnectionManager() (ConnectionManager.cpp:74)
==23735== by 0×8057288: MainThread::~MainThread() (MainThread.cpp:73)
==23735== by 0x8077B2F: main (Main.cpp:177)
==23735== Address 0×0 is not stack’d, malloc’d or (recently) free’d
==23735==
能夠看到說明爲沒法訪問Address 0x0,明顯爲一處錯誤。
這樣valgrind直接給出了出錯緣由以及程序中全部的內存調用、釋放記錄,很是智能,在得知錯誤緣由的狀況下,找出錯誤就效率高多了。
再說一句,valgrind同時給出了程序的Memory Leak狀況的報告,給出了new-delete對應狀況,全部泄漏點位置給出,這一點在其餘工具很難作到,十分好用。