
碼農那點事兒web
關注咱們,一塊兒學習進步數據庫

以前一段時間,由於咱們發現的一個 SaaS 應用程序會間歇性地卡頓、變慢,由於很長時間都沒有定位到緣由,因此解決的辦法就只能是重啓。apache
這個現象和以前咱們遇到的程序變得卡頓不太同樣,由於咱們發現這個應用程序不只在高流量期間時會變慢,有時在低流量時期也會變慢。因此這令你們都很奇怪。編程
這類應用程序的變慢,從新啓動以後就能夠維持一段時間,可是過段時間又有可能會再次出現。微信
故障排除app
當咱們準備排查這個問題的時候,咱們在應用程序速度很慢的時候,嘗試着捕獲了這個應用程序的線程 Dump。有不少種方式來捕獲線程轉 Dump,咱們選擇了「jstack」工具來獲取。框架
在問題發生時得到線程 Dump 是很是關鍵的!編輯器
而後咱們將捕獲的線程Dump上傳到一個線上線程Dump分析工具(https://fastthread.io/)。該工具當即幫咱們生成了一份報告。工具
報告當即找出了問題的根本緣由。分析工具上顯示「http-nio-8080-exec-121」線程阻塞了 100 多個線程。下面是傳遞依賴圖,展現了阻塞線程:性能


接下來,咱們隨便找一個被"http-nio-8080-exec-121"阻塞的線程,看一下他的堆棧信息:

前面咱們剛剛分析過,「http-nio-8080-exec-121」得到了 org.apache.log4j.Logger 的鎖,正在進行其餘操做,而鎖並無被釋放,因此其餘線程想要得到鎖就只能被阻塞。
其他的全部被阻塞的線程也在等待獲取 org.apache.log4j.Logger 的鎖。所以,每當任何應用程序線程試圖記錄日誌時,它都會由於沒法獲取到鎖而進入阻塞狀態。
剛開始咱們也沒有太多的頭緒,後來咱們嘗試藉助 Google 的力量,而後咱們用谷歌搜索了"org.apache.log4j.Logger 阻塞線程"這樣的關鍵字。
咱們在 Apache Log4j bug 數據庫中偶然發現了這個有趣的 Bug,並且這個Bug早在2015年就被發現了。(https://bz.apache.org/bugzilla/show_bug.cgi?id=57714 )。

這是 Log4J 框架中已知的 bug 之一,也是開發新的 Log4j2 框架的主要緣由之一。
因爲這個 bug,任何試圖打印日誌的線程都進入了阻塞狀態。它致使整個應用程序戛然而止。一旦應用程序從 Log4j 遷移到 Log4j2 框架,問題就解決了。
結論
Log4j 已經在 2015 年 8 月開始就再也不被維護了。若是您的應用程序仍在使用 Log4J 框架,強烈建議升級到 Log4j2 框架。Log4j2 不只僅是 Log4j 框架的下一個版本,它是一個從零開始編寫的新框架,它有不少性能改進。
最後,若是網站遇到程序被拖慢的問題,那麼也能夠考慮一下這個因素。
end
● 後臺回覆【網頁特效】,免費獲取網頁製做特效源碼!
![]()
![]()
支持就點下在看並 轉發朋友圈吧
本文分享自微信公衆號 - 碼農那點事兒(code_ndsh_2018)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。