由於每一個鏈路都會對其性能形成影響,應該是全鏈路的修改壓測(ak大神常常說全鏈路)。本次基本就是局域網,因此並無怎麼優化,其實也應該考慮進去的。html
Linux系統參數層面的修改:java
一、修改可打開文件數和用戶最多可開發進程數nginx
命令:ulimit -n 655350web
ulimit –u 655350apache
能夠經過ulimit –a查看參數設置,不設置時默認爲1024,默認狀況下,你會發現請求數到到必定數值後,再也上不去了。tomcat
二、操做系統內核優化服務器
net.ipv4.tcp_max_tw_buckets = 6000cookie
timewait 的數量,默認是180000。網絡
net.ipv4.ip_local_port_range = 1024 65000數據結構
容許系統打開的端口範圍。
net.ipv4.tcp_tw_recycle = 1
啓用timewait 快速回收。
net.ipv4.tcp_tw_reuse = 1
開啓重用。容許將TIME-WAIT sockets 從新用於新的TCP 鏈接。
net.ipv4.tcp_syncookies = 1
開啓SYN Cookies,當出現SYN等待隊列溢出時,啓用cookies來處理。
net.core.somaxconn = 262144
web 應用中listen函數的backlog默認會給咱們內核參數的net.core.somaxconn限制到128,而nginx定義的NGX_LISTEN_BACKLOG默認爲511,因此有必要調整這個值。
net.core.netdev_max_backlog = 262144
每一個網絡接口接收數據包的速率比內核處理這些包的速率快時,容許送到隊列的數據包的最大數目。
net.ipv4.tcp_max_orphans = 262144
系統中最多有多少個TCP套接字不被關聯到任何一個用戶文件句柄上。若是超過這個數字,故而鏈接將即刻被複位並打印出警告信息。這個限制僅僅是爲了防止簡單的DoS攻擊,不能過度依靠它或者人爲地減少這個值,更應該增長這個值(若是增長了內存以後)。
net.ipv4.tcp_max_syn_backlog = 262144
記錄的那些還沒有收到客戶端確認信息的鏈接請求的最大值。對於有128M內存的系統而言,缺省值是1024,小內存的系統則是128。
net.ipv4.tcp_timestamps = 0
時間戳能夠避免序列號的卷繞。一個1Gbps的鏈路確定會遇到之前用過的序列號。時間戳可以讓內核接受這種「異常」的數據包。這裏須要將其關掉。
net.ipv4.tcp_synack_retries = 1
爲了打開對端的鏈接,內核須要發送一個SYN 並附帶一個迴應前面一個SYN的ACK。也就是所謂三次握手中的第二次握手。這個設置決定了內核放棄鏈接以前發送SYN+ACK包的數量。
net.ipv4.tcp_syn_retries = 1
在內核放棄創建鏈接以前發送SYN 包的數量。
net.ipv4.tcp_fin_timeout = 1
若是套接字由本端要求關閉,這個參數決定了它保持在FIN-WAIT-2狀態的時間。對端能夠出錯並永遠不關閉鏈接,甚至意外當機。缺省值是60秒。2.2內核的一般值是180秒,3你能夠按這個設置,但要記住的是,即便你的機器是一個輕載的WEB服務器,也有由於大量的死套接字而內存溢出的風險,FIN-WAIT-2的危險性比FIN-WAIT-1要小,由於它最多隻能吃掉1.5K內存,可是它們的生存期長些。
net.ipv4.tcp_keepalive_time = 30
當keepalive 起用的時候,TCP發送keepalive消息的頻度。缺省是2小時
內核參數優化設置在/etc/sysctl.conf文件中。
上面2個都調整同樣的狀況下,開始準備測試tomcat7(jdk7)與tomcat8(jdk8)的一些性能測試了。
因爲各各緣由複雜服務無法測試,先僅僅是測試靜態頁面。
jvm層面優化:
Jdk7:
-Xms2G -Xmx2G -Xmn512m -XX:PermSize=512M -XX:MaxPermSize=512M -XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled -XX:+HeapDumpOnOutOfMemoryError -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc:/appl/gc.log -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly
Jdk8:
-Xms2G -Xmx2G -Xmn512m -XX:MetaspaceSize=512M -XX:MaxMetaspaceSize=512M -XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled -XX:+HeapDumpOnOutOfMemoryError -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc:/appl/gc.log -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly
須要特別說明下:
元數據空間,專門用來存元數據的,它是jdk8裏特有的數據結構用來替代perm。
Jdk7:
出現了屢次Full GC了。
其中,CMS-initial-mark和CMS-remark會stop-the-world。
因此選擇cms垃圾回收器,用jstat 相關命令看到的FGC每次都是加2的變化狀況。
Jdk8:
一次Full GC也沒有發生。從這裏也能夠看出tomcat8的實現機制比tomcat7的要好些(相同條件沒有產生多餘對象從而致使Full GC問題)。
須要特別說明下:
年輕代的gc日誌7和8略有不一樣
jdk8把日誌打得更全了 ,jdk8的gc日誌與jdk7的有所不一樣,聽大佬們說各各jdk的日誌都有所不一樣,其實這裏8的這個和7的意思同樣,只是7沒有表達出來而已。
經過壓力測試結果來看,jdk7每隔一段時間會出現tps大的降低,就是俗話說的卡頓。
而jdk8沒有啥卡頓現象
而jdk7的波動就特別明顯
該效果8比7的效果請求要好。
因爲jdk7 gc日誌,
CMS開始回收tenured generation collection。這階段是CMS初始化標記的階段,從垃圾回收的「根對象」開始,且只掃描直接與「根對象」直接關聯的對象,並作標記,在此期間,其餘線程都會中止。
tenured generation的空間是1572864K,在容量爲1205558K時開始執行初始標記。
說明-XX:CMSInitiatingOccupancyFraction=75已經達到觸發(Background )CMS GC的條件。
應該擴大堆空間大小,在此修改僅僅是修改了堆其餘不變,其餘參數仍是原來上面的參數
Jdk7,jdk8:
-Xms4G -Xmx4G -Xmn1365m
查看gc日誌,發現的確都沒有FGC了,可是ygc差距很大,在此表示tomcat8(jdk8)比tomcat7(jdk7)好好像。
Jdk7 ygc時間過長:
Jdk8 ygc很是好:
其實對於ygc的分享特別複雜,jvm的參數調整算是小調,最關鍵的應該在產生對象的地方,即應用本事,採用合理的架構,合理的數據結構結合一些技巧來達到等。
因爲測試的是靜態頁面,那麼只有tomcat代碼了,表示8的實現比7的實現方面的確要好(有空去準備去讀讀tomcat源碼到時候在分享分享)。
經過日誌查看jdk7的老年代使用率很低,準備在此進行調整,在堆大小不變的狀況下調全年輕代的大小。
Jdk7,jdk8都進行調整其餘參數還保持上面不變。
-Xms4G -Xmx4G -Xmn3g
效果有所改善(tps也張了200多),可是仍是不如jdk8的,多是tomcat內部實現8就是比7好。
次中間還嘗試過更大堆以及年輕代的調整 如6G 8G 10G等都沒有太大變化有些還不如4G點這個好,因此並非堆空間設置越大越好。
Jvm目前只能調到這塊了,後續若是有啥發現或者大佬們的建議在調整。
Tomcat自己這塊的調優
Tomcat 7/8 的優化參數有點不同,最好按下面的方式看一下官網這個文檔是否還保留着這個參數
啓動tomcat,訪問該地址,下面要講解的一些配置信息,在該文檔下都有說明的:
文檔:http://127.0.0.1:8080/docs/config
你也能夠直接看網絡版本:
Tomcat 7 文檔:https://tomcat.apache.org/tomcat-7.0-doc/config/
Tomcat 8 文檔:https://tomcat.apache.org/tomcat-8.0-doc/config/
若是你須要查看 Tomcat 的運行狀態能夠配置tomcat管理員帳戶,而後登錄Tomcat後臺進行查看。
在修改jvm參數以後tps怎麼都上不去的狀況下面經過查看線程dump
Tomcat七、tomcat8狀況同樣,發現不少都堵塞在這塊了。
這塊涉及到代碼這塊了(tomcat的源碼這塊了)
經過查看源碼發現這塊是涉及到了tomcat線程池這塊了,稍微會詳細說明下,先看看一些簡單配置。
默認配置,能夠配置寫那些值呢?
Tomcat8多了一個nio2
這個也比較重要
這個就是關於池的配置了,有那些參數和怎麼實現的呢?
Tomcat的實如今org.apache.catalina.core.StandardThreadExecutor
裏面的參數有
簡單理解就是:
maxThreads - Tomcat線程池最多能起的線程數
maxConnections - Tomcat最多能併發處理的請求(鏈接)
acceptCount - Tomcat維護最大的對列數
minSpareThreads - Tomcat初始化的線程池大小或者說Tomcat線程池最少會有這麼多線程。
比較容易弄混的是maxThreads和maxConnections這兩個參數:
maxThreads是指Tomcat線程池作多能起的線程數
maxConnections則是Tomcat一瞬間作多可以處理的併發鏈接數。好比maxThreads=1000,maxConnections=800,假設某一瞬間的併發時1000,那麼最終Tomcat的線程數將會是800,即同時處理800個請求,剩餘200進入隊列「排隊」,若是acceptCount=100,那麼有100個請求會被拒掉。
注意:根據前面所說,只是併發那一瞬間Tomcat會起800個線程處理請求,可是穩定後,某一瞬間可能只有不多的線程處於RUNNABLE狀態,大部分線程是TIMED_WAITING,若是你的應用處理時間夠快的話。因此真正決定Tomcat最大可能達到的線程數是maxConnections這個參數和併發數,當併發數超過這個參數則請求會排隊,這時響應的快慢就看你的程序性能了。
這些僅僅是告訴咱們,若是須要了解細節還須要閱讀下源碼。有些讀了源碼可能參數的理解更清楚了。
Tomcat的線程池的名字也叫做ThreadPoolExecutor,剛開始看源代碼的時候還覺得是使用了JDK的ThreadPoolExecutor了呢,後面仔細查看才知道是Tomcat本身實現的一個ThreadPoolExecutor,不過基本上都差很少。
看到這裏覺得tomcat線程池的原理和jdk的線程池原理同樣了,其實不是的。
問題的關鍵在這裏
TaskQueue這個任務隊列是專門爲線程池而設計的。優化任務隊列以適當地利用線程池執行器內的線程。
Jdk的execute執行策略: 優先offer到queue,queue滿後再擴充線程到maxThread,若是已經到了maxThread就reject
Tomcat的execute執行策略: 優先擴充線程到maxThread,再offer到queue,若是滿了就reject比較適合於業務處理須要遠程資源的場景
修改成:
因爲多是靜態頁面返回很快,設置500 800 1000線程效果都不怎麼明顯,若是是加項目應該會有所區別,因此線程池也並非越多越好。
Tomcat7和tomcat8性能都有所提高,因此池很重要,可是8和7的tps在都提升了2000左右。在修改線程池以後,查看jvm gc狀況都良好,因此並無在此調整jvm參數了。
通過這麼多分析也瞭解到了tomcat該如何調優了,以及tomcat七、tomcat8的一些性能區別了。
因爲測試的是靜態頁面,不少有些問題尚未涉及到,後續若是測試服務估計須要修改,調試排查的問題更多,到時候繼續查看後續文章!!