前些天發現XEN虛擬機上的Nginx服務器存在一個問題:軟中斷太高,並且大部分都集中在同一個CPU,一旦系統繁忙,此CPU就會成爲木桶的短板。html
在問題服務器上運行「top」命令能夠很明顯看到「si」存在異樣,大部分軟中斷都集中在 1 號CPU上,其它的CPU徹底使不上勁兒:linux
shell> top Cpu0: 11.3%us, 4.7%sy, 0.0%ni, 82.5%id, ... 0.8%si, 0.8%st Cpu1: 21.3%us, 7.4%sy, 0.0%ni, 51.5%id, ... 17.8%si, 2.0%st Cpu2: 16.6%us, 4.5%sy, 0.0%ni, 77.7%id, ... 0.8%si, 0.4%st Cpu3: 15.9%us, 3.6%sy, 0.0%ni, 79.3%id, ... 0.8%si, 0.4%st Cpu4: 17.7%us, 4.9%sy, 0.0%ni, 75.3%id, ... 1.2%si, 0.8%st Cpu5: 23.6%us, 6.6%sy, 0.0%ni, 68.1%id, ... 0.9%si, 0.9%st Cpu6: 18.1%us, 4.9%sy, 0.0%ni, 75.7%id, ... 0.4%si, 0.8%st Cpu7: 21.1%us, 5.8%sy, 0.0%ni, 71.4%id, ... 1.2%si, 0.4%st
查詢一下軟中斷相關數據,發現主要集中在 NET_RX 上,猜想是網卡問題:nginx
shell> watch -d -n 1 'cat /proc/softirqs' CPU0 CPU1 CPU2 ... CPU7 HI: 0 0 0 ... 0 TIMER: 3692566284 3692960089 3692546970 ... 3693032995 NET_TX: 130800410 652649368 154773818 ... 308945843 NET_RX: 443627492 3802219918 792341500 ... 2546517156 BLOCK: 0 0 0 ... 0 BLOCK_IOPOLL: 0 0 0 ... 0 TASKLET: 0 0 0 ... 0 SCHED: 1518716295 335629521 1520873304 ... 1444792018 HRTIMER: 160 1351 131 ... 196 RCU: 4201292019 3982761151 4184401659 ... 4039269755
查詢宿主機,發現網卡其運行在單隊列模式下:git
shell> grep -A 10 -i network /var/log/dmesg Initalizing network drop monitor service Intel(R) Gigabit Ethernet Network Driver - version 3.0.19 igb 0000:05:00.0: Intel(R) Gigabit Ethernet Network Connection igb 0000:05:00.0: eth0: (PCIe:2.5GT/s:Width x4) 00:1b:21:bf:b3:2c igb 0000:05:00.0: eth0: PBA No: G18758-002 igb 0000:05:00.0: Using MSI-X ... 1 rx queue(s), 1 tx queue(s) igb 0000:05:00.1: Intel(R) Gigabit Ethernet Network Connection igb 0000:05:00.1: eth1: (PCIe:2.5GT/s:Width x4) 00:1b:21:bf:b3:2d igb 0000:05:00.1: eth1: PBA No: G18758-002 igb 0000:05:00.1: Using MSI-X ... 1 rx queue(s), 1 tx queue(s)
接着確認一下網卡的中斷號,由於是單隊列,因此只有一箇中斷號 45:github
shell> grep eth /proc/interrupts | awk '{print $1, $NF}' 45: eth0
知道了網卡的中斷號,就能夠查詢其中斷親緣性配置「smp_affinity」:api
shell> cat /proc/irq/45/smp_affinity 02
這裏的 02 其實是十六進制,表示 1 號CPU,計算方法以下(參考資料):服務器
Binary Hex CPU 0 0001 1 CPU 1 0010 2 CPU 2 0100 4 + CPU 3 1000 8 ----------------------- both 1111 f
說明:若是 4 個CPU都參與中斷處理,那麼設爲 f;同理 8 個CPU的就設置成 ff:架構
shell> echo ff > /proc/irq/45/smp_affinity
此外還有一個相似的配置「smp_affinity_list」:app
shell> cat /proc/irq/45/smp_affinity_list 1
兩個配置是相通的,修改了一個,另外一個會跟着變。不過「smp_affinity_list」使用的是十進制,相比較「smp_affinity」的十六進制,可讀性更好些。
瞭解了這些基本知識,咱們能夠嘗試換一個CPU試試看會發生什麼:
echo 7 > /proc/irq/45/smp_affinity_list
再經過「top」命令觀察,會發現處理軟中斷的CPU變成了 7 號CPU。
說明:若是但願多個CPU參與中斷處理的話,可使用相似下面的語法:
echo 3,5 > /proc/irq/45/smp_affinity_list echo 0-7 > /proc/irq/45/smp_affinity_list
壞消息是對單隊列網卡而言,「smp_affinity」和「smp_affinity_list」配置多CPU無效。
好消息是Linux支持RPS,通俗點來講就是在軟件層面模擬實現硬件的多隊列網卡功能。
首先看看如何配置RPS,若是CPU個數是 8 個的話,能夠設置成 ff:
shell> echo ff > /sys/class/net/eth0/queues/rx-0/rps_cpus
接着配置內核參數rps_sock_flow_entries(官方文檔推薦設置: 32768):
shell> sysctl net.core.rps_sock_flow_entries=32768
最後配置rps_flow_cnt,單隊列網卡的話設置成rps_sock_flow_entries便可:
echo 32768 > /sys/class/net/eth0/queues/rx-0/rps_flow_cnt
說明:若是是多隊列網卡,那麼就按照隊列數量設置成 rps_sock_flow_entries / N 。
作了如上的優化後,咱們再運行「top」命令能夠看到軟中斷已經分散到了兩個CPU:
shell> top Cpu0: 24.8%us, 9.7%sy, 0.0%ni, 52.2%id, ... 11.5%si, 1.8%st Cpu1: 8.8%us, 5.1%sy, 0.0%ni, 76.5%id, ... 7.4%si, 2.2%st Cpu2: 17.6%us, 5.1%sy, 0.0%ni, 75.7%id, ... 0.7%si, 0.7%st Cpu3: 11.9%us, 7.0%sy, 0.0%ni, 80.4%id, ... 0.7%si, 0.0%st Cpu4: 15.4%us, 6.6%sy, 0.0%ni, 75.7%id, ... 1.5%si, 0.7%st Cpu5: 20.6%us, 6.9%sy, 0.0%ni, 70.2%id, ... 1.5%si, 0.8%st Cpu6: 12.9%us, 5.7%sy, 0.0%ni, 80.0%id, ... 0.7%si, 0.7%st Cpu7: 15.9%us, 5.1%sy, 0.0%ni, 77.5%id, ... 0.7%si, 0.7%st
疑問:理論上講,我已經設置了RPS爲ff,應該全部 8 個CPU一塊兒分擔軟中斷纔對,可實際結果只有兩個,有知道緣由的請賜教,可是無論怎麼說,兩個總好過一個。
此外,由於這是一臺Nginx服務器,因此經過「worker_cpu_affinity」指令能夠配置Nginx使用哪些CPU,如此一來咱們即可以繞開高負載的CPU,對性能會有一些幫助。
補充:若是服務器是NUMA架構的話,那麼「numactl –cpubind」可能也會有用。