爲了更好地實現對項目的管理,咱們將組內一個項目遷移到MDP框架(基於Spring Boot),隨後咱們就發現系統會頻繁報出Swap區域使用量太高的異常。筆者被叫去幫忙查看緣由,發現配置了4G堆內內存,可是實際使用的物理內存居然高達7G,確實不正常。JVM參數配置是「-XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M -XX:+AlwaysPreTouch -XX:ReservedCodeCacheSize=128m -XX:InitialCodeCacheSize=128m, -Xss512k -Xmx4g -Xms4g,-XX:+UseG1GC -XX:G1HeapRegionSize=4M」,實際使用的物理內存以下圖所示:html
筆者在項目中添加-XX:NativeMemoryTracking=detail
JVM參數重啓項目,使用命令jcmd pid VM.native_memory detail
查看到的內存分佈以下:java
發現命令顯示的committed的內存小於物理內存,由於jcmd命令顯示的內存包含堆內內存、Code區域、經過unsafe.allocateMemory和DirectByteBuffer申請的內存,可是不包含其餘Native Code(C代碼)申請的堆外內存。因此猜想是使用Native Code申請內存所致使的問題。linux
爲了防止誤判,筆者使用了pmap查看內存分佈,發現大量的64M的地址;而這些地址空間不在jcmd命令所給出的地址空間裏面,基本上就判定就是這些64M的內存所致使。git
由於筆者已經基本上肯定是Native Code所引發,而Java層面的工具不便於排查此類問題,只能使用系統層面的工具去定位問題。github
gperftools的使用方法能夠參考gperftools,gperftools的監控以下:spring
從上圖能夠看出:使用malloc申請的的內存最高到3G以後就釋放了,以後始終維持在700M-800M。筆者第一反應是:難道Native Code中沒有使用malloc申請,直接使用mmap/brk申請的?(gperftools原理就使用動態連接的方式替換了操做系統默認的內存分配器(glibc)。)oracle
由於使用gperftools沒有追蹤到這些內存,因而直接使用命令「strace -f -e"brk,mmap,munmap" -p pid」追蹤向OS申請內存請求,可是並無發現有可疑內存申請。strace監控以下圖所示:框架
由於使用strace沒有追蹤到可疑內存申請;因而想着看看內存中的狀況。就是直接使用命令gdp -pid pid
進入GDB以後,而後使用命令dump memory mem.bin startAddress endAddress
dump內存,其中startAddress和endAddress能夠從/proc/pid/smaps中查找。而後使用strings mem.bin
查看dump的內容,以下:ide
從內容上來看,像是解壓後的JAR包信息。讀取JAR包信息應該是在項目啓動的時候,那麼在項目啓動以後使用strace做用就不是很大了。因此應該在項目啓動的時候使用strace,而不是啓動完成以後。spring-boot
項目啓動使用strace追蹤系統調用,發現確實申請了不少64M的內存空間,截圖以下:
使用該mmap申請的地址空間在pmap對應以下:
由於strace命令中已經顯示申請內存的線程ID。直接使用命令jstack pid
去查看線程棧,找到對應的線程棧(注意10進制和16進制轉換)以下:
這裏基本上就能夠看出問題來了:MCC(美團統一配置中心)使用了Reflections進行掃包,底層使用了Spring Boot去加載JAR。由於解壓JAR使用Inflater類,須要用到堆外內存,而後使用Btrace去追蹤這個類,棧以下:
而後查看使用MCC的地方,發現沒有配置掃包路徑,默認是掃描全部的包。因而修改代碼,配置掃包路徑,發佈上線後內存問題解決。
雖然問題已經解決了,可是有幾個疑問:
帶着疑問,筆者直接看了一下Spring Boot Loader那一塊的源碼。發現Spring Boot對Java JDK的InflaterInputStream進行了包裝而且使用了Inflater,而Inflater自己用於解壓JAR包的須要用到堆外內存。而包裝以後的類ZipInflaterInputStream沒有釋放Inflater持有的堆外內存。因而筆者覺得找到了緣由,立馬向Spring Boot社區反饋了這個bug。可是反饋以後,筆者就發現Inflater這個對象自己實現了finalize方法,在這個方法中有調用釋放堆外內存的邏輯。也就是說Spring Boot依賴於GC釋放堆外內存。
筆者使用jmap查看堆內對象時,發現已經基本上沒有Inflater這個對象了。因而就懷疑GC的時候,沒有調用finalize。帶着這樣的懷疑,筆者把Inflater進行包裝在Spring Boot Loader裏面替換成本身包裝的Inflater,在finalize進行打點監控,結果finalize方法確實被調用了。因而筆者又去看了Inflater對應的C代碼,發現初始化的使用了malloc申請內存,end的時候也調用了free去釋放內存。
此刻,筆者只能懷疑free的時候沒有真正釋放內存,便把Spring Boot包裝的InflaterInputStream替換成Java JDK自帶的,發現替換以後,內存問題也得以解決了。
這時,再返過來看gperftools的內存分佈狀況,發現使用Spring Boot時,內存使用一直在增長,忽然某個點內存使用降低了好多(使用量直接由3G降爲700M左右)。這個點應該就是GC引發的,內存應該釋放了,可是在操做系統層面並無看到內存變化,那是否是沒有釋放到操做系統,被內存分配器持有了呢?
繼續探究,發現系統默認的內存分配器(glibc 2.12版本)和使用gperftools內存地址分佈差異很明顯,2.5G地址使用smaps發現它是屬於Native Stack。內存地址分佈以下:
到此,基本上能夠肯定是內存分配器在搗鬼;搜索了一下glibc 64M,發現glibc從2.11開始對每一個線程引入內存池(64位機器大小就是64M內存),原文以下:
按照文中所說去修改MALLOC_ARENA_MAX環境變量,發現沒什麼效果。查看tcmalloc(gperftools使用的內存分配器)也使用了內存池方式。
爲了驗證是內存池搞的鬼,筆者就簡單寫個不帶內存池的內存分配器。使用命令gcc zjbmalloc.c -fPIC -shared -o zjbmalloc.so
生成動態庫,而後使用export LD_PRELOAD=zjbmalloc.so
替換掉glibc的內存分配器。其中代碼Demo以下:
#include<sys/mman.h>
#include<stdlib.h>
#include<string.h>
#include<stdio.h>
//做者使用的64位機器,sizeof(size_t)也就是sizeof(long)
void* malloc ( size_t size ) {
long* ptr = mmap( 0, size + sizeof(long), PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, 0, 0 );
if (ptr == MAP_FAILED) {
return NULL;
}
*ptr = size; // First 8 bytes contain length.
return (void*)(&ptr[1]); // Memory that is after length variable
}
void *calloc(size_t n, size_t size) {
void* ptr = malloc(n * size);
if (ptr == NULL) {
return NULL;
}
memset(ptr, 0, n * size);
return ptr;
}
void *realloc(void *ptr, size_t size) {
if (size == 0) {
free(ptr);
return NULL;
}
if (ptr == NULL) {
return malloc(size);
}
long *plen = (long*)ptr;
plen--; // Reach top of memory
long len = *plen;
if (size <= len) {
return ptr;
}
void* rptr = malloc(size);
if (rptr == NULL) {
free(ptr);
return NULL;
}
rptr = memcpy(rptr, ptr, len);
free(ptr);
return rptr;
}
void free (void* ptr ) {
if (ptr == NULL) {
return;
}
long *plen = (long*)ptr;
plen--; // Reach top of memory
long len = *plen; // Read length
munmap((void*)plen, len + sizeof(long));
}
複製代碼
經過在自定義分配器當中埋點能夠發現其實程序啓動以後應用實際申請的堆外內存始終在700M-800M之間,gperftools監控顯示內存使用量也是在700M-800M左右。可是從操做系統角度來看進程佔用的內存差異很大(這裏只是監控堆外內存)。
筆者作了一下測試,使用不一樣分配器進行不一樣程度的掃包,佔用的內存以下:
爲何自定義的malloc申請800M,最終佔用的物理內存在1.7G呢?
由於自定義內存分配器採用的是mmap分配內存,mmap分配內存按需向上取整到整數個頁,因此存在着巨大的空間浪費。經過監控發現最終申請的頁面數目在536k個左右,那實際上向系統申請的內存等於512k * 4k(pagesize) = 2G。 爲何這個數據大於1.7G呢?
由於操做系統採起的是延遲分配的方式,經過mmap向系統申請內存的時候,系統僅僅返回內存地址並無分配真實的物理內存。只有在真正使用的時候,系統產生一個缺頁中斷,而後再分配實際的物理Page。
整個內存分配的流程如上圖所示。MCC掃包的默認配置是掃描全部的JAR包。在掃描包的時候,Spring Boot不會主動去釋放堆外內存,致使在掃描階段,堆外內存佔用量一直持續飆升。當發生GC的時候,Spring Boot依賴於finalize機制去釋放了堆外內存;可是glibc爲了性能考慮,並無真正把內存歸返到操做系統,而是留下來放入內存池了,致使應用層覺得發生了「內存泄漏」。因此修改MCC的配置路徑爲特定的JAR包,問題解決。筆者在發表這篇文章時,發現Spring Boot的最新版本(2.0.5.RELEASE)已經作了修改,在ZipInflaterInputStream主動釋放了堆外內存再也不依賴GC;因此Spring Boot升級到最新版本,這個問題也能夠獲得解決。
紀兵,2015年加入美團,目前主要從事酒店C端相關的工做。