WeTest導讀前端
服務器性能測試是一項很是重要並且必要的工做,本文是做者Micheal在對服務器進行性能測試的過程當中不斷摸索出來的一些實用策略,經過定位問題,分析緣由以及解決問題,實現對服務器進行更有針對性的優化,提高服務器的性能。java
1.服務器性能測試小結講到服務器性能大部分人會想到這個服務器的架構是什麼樣子的,用的什麼epoll,select,spring,tornado之類的。其實從本質上來看的話目前大部分的服務器主要包括邏輯層以及DB層,咱們採用的各類框架組件處於邏輯服務器中,以下圖所示。python
服務器架構本質mysql
服務器性能測試是一項比較繁瑣的事情,做爲沒有作過性能測試的同窗可能須要理清楚如下幾個事情。nginx
1.1. 協議分析程序員
首先是協議分析,性能測試本質上是咱們用代碼來模擬真實的用戶請求,因此咱們必需要知道發送出去的請求內容才能模擬。在典型的CS服務器中不少使用了protobuf,thrift,tdr(騰訊自研)來序列化以及反序列號請求內容。web
序列化以後一方面能夠對數據進行壓縮處理,另外一方面也避免請求內容明文傳輸形成被抓包·泄漏數據的危險。以前有過服務器傳輸數據的時候使用的是明文直接發送,並且這個數據是一些敏感的sql語句,這樣首先暴露了數據庫的表結構,同時不法分子能夠經過模擬發包形成「脫褲」甚至是數據被清空。算法
1.1.1. Protobufspring
谷歌出品,必屬精品。Protobuf使用起來很方便,學習成本很是低,並且序列化和反序列號的接口很容易使用。同時它相對於xml以及json,極大的的減少了數據佔用的空間,減小了傳輸成本。目前支持包括C++,java以及python等多個語言。Protobuf目前用的比較多,打解包也很方便,比較推薦使用。sql
1.1.2. Thrift
Thrift是一個跨語言的輕量級rpc消息和數據交換框架。Thrift支持幾乎絕大部分主流的語言,包括C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, Smalltalk, and OCaml,雖然大部分我都沒有用過。相對於protobuf,thrift提供了全套RPC解決方案,包括序列化機制、傳輸層、併發處理框架等,也由於如此thrift的學習成本比較高。
1.1.3. 騰訊自研協議tdrTdr是騰訊自研跨平臺多語言數據表示組件,主要用於基於數據的序列化反序列化(支持二進制方式和XML文本方式)以及ORM數據存儲。普遍用於互娛自研遊戲和部分代理遊戲。在性能上基本和protobuf差很少,主要應用在C++程序中。
在作服務器性能測試以前,咱們須要瞭解它的協議是怎麼定義的。
1.2. 機器人管理
本質上機器人管理就是一個調度控制器,在獲取須要發送的請求協議以後,須要有一個框架來管理全部的機器人,控制機器人的啓動,發送請求以及中止的動做。框架的選擇須要根據服務器的實際狀況來,不一樣的業務場景,使用不一樣的框架產生的壓力上限也會不同。
機器人管理框架
以一個簡單的多線程框架爲例,主線程負責控制邏輯,管理全部的機器人狀態信息。子線程執行每一個機器人的任務,包括鏈接服務器,發送數據,接收數據,斷開鏈接等。
1.3. 結果統計
機器人發送請求包以後,通常是要等待服務器的響應回包。服務器那邊能夠計算本次壓測過程當中各項業務數據,包括TPS,總的收發包量等。
不可能在測試過程當中一直盯着各個數據看,咱們須要把每項數據記錄下來,後續綜合各項結果進行分析。
這裏的結果統計除了須要統計每一個機器人收到回包的結果,還須要統計服務器在壓測過程當中的各項性能數據變化。一旦客戶端的壓力上到必定值時,服務器某項資源支撐不了的話,說明這個資源可能存在短板,存在能夠優化的空間。
2. 性能結果分析
性能結果分析是一個比較複雜的過程。須要綜合硬件、操做系統、應用程序等多方面來定位。
2.1. 硬件的影響
硬件對服務器性能影響仍是蠻大的,若是是土豪的話,能夠直接買最好的。咱們分析硬件主要是但願選擇合適的配置,節約資源,避免出現高射炮打蚊子的狀況。
2.1.1. CPU在資金的充足下,通常來講CPU的數量越多,主頻越高,那麼服務器的性能也就會越好。在實際測試過程當中,若是在大壓力下持續觀察CPU的使用率很低,那麼CPU的資源基本上是能夠知足服務器要求的。這樣的狀況實際上是有點浪費CPU資源的,比較理想的狀況是壓力不大的時候CPU利用率比較低,壓力上來以後CPU利用率保持在60%-70%。
大部分的CPU在同一時間內只能運行一個線程,可是超線程的處理器能夠在同一個時間運行多個線程,咱們能夠利用處理前超線程特性提升系統性能。雖然採用超線程技術能同時執行兩個線程,但它並不象兩個真正的CPU那樣,每一個CPU都具備獨立的資源。當兩個線程都同時須要某一個資源時,其中一個要暫時中止,並讓出資源,直到這些資源閒置後才能繼續。所以超線程的性能並不等於兩顆CPU的性能。
2.1.2. 內存
內存的大小也是影響服務器性能的一個重要因素。內存過小,系統進程要被阻塞,應用程序會變得緩慢,甚至是失去響應;若是太大的話,也是形成一種浪費。Linux系統中採用物理內存和虛擬內存兩種方式,使用虛擬內存能夠緩解物理內存的不足,可是若是佔用過多的虛擬內存的話,應用程序的性能會明顯的降低。
2.1.3. 網絡帶寬
網絡帶寬的大小限制了客戶端與服務器交互的流量,相對其餘硬件資源,網絡帶寬在價格上更貴。這須要咱們合理預估服務器的可服務器能力,須要佔用的帶寬資源。
2.1.4. 磁盤IO
目前磁盤都是機械方式運做的,主要體如今磁盤讀寫前尋找磁道的過程。磁盤自帶的讀寫緩存大小,對於磁盤讀寫速度相當重要。讀寫速度快的磁盤,一般都帶有較大的讀寫緩存。磁盤的尋道過程是機械方式,決定了其隨機讀寫速度將明顯低於順序讀寫。在咱們作系統設計和實現時,須要考慮到磁盤的這一特性。
2.2. 操做系統及軟件
2.2.1. 版本
不一樣的操做系統在內核實現上可能各不相同,於是對運行在上面的應用程序來講可能影響比較大。
筆者並無作過度析不一樣操做系統對服務器性能的影響,由於只用過Linux開發服務器程序。Linux操做系統在這十幾年發展的異常迅猛,目前大部分的服務器都是運行在Linux操做系統上的。Linux目前具備最好的生態系統,服務器端的各類軟件都爲它而設計,默認都認爲你是在 Linux 上跑,你要是整一個非 Linux 的服務器,你得有足夠的心理準備,由於出現任何問題,你可能未必能找到能幫你解決問題的人。
2.2.2. 參數配置先說一個小故事。福特公司一套重要設備出現故障,找了不少人來維修,結果都沒有維修好,沒辦法了,就在購買設備的英國公司高價聘請一位工程師過來維修,工程師來到以後,反覆查找緣由,最後在一個小零件上劃了一條線,而後對旁邊福特公司的人說,在劃線的地方切掉就行了,果不其然,切掉以後故障真的解除了,按照合約,福特公司應支付公司一萬美圓,周圍的人都唏噓不已,感嘆一條線就能夠價值一萬美圓,工程師回答到:那條線只值一美圓,而怎樣找到那條線值9999美圓。咱們在測試服務器的過程當中,常常會遇到性能上不去。查看CPU,網絡,IO消耗都挺低的,就是定位不到問題的緣由。有經驗的程序員可能會告訴你你把某個參數修改一下,立馬性能噌噌噌上去了。好比mysql相關設置,系統文件描述符,緩衝區大小,time_wait快速回收設置等,甚至是線程池配置的線程個數也會對服務器的性能產生較大的影響。
關於數據庫參數的設置,好比mysql的配置文件my.cnf文件中,修改不一樣的配置(好比innodb_flush_log_at_trx_commit 設置爲0,1仍是2 )可能會對數據庫的讀寫性能影響很大。
2.2.3. 應用程序自己實現好比程序中須要頻繁申請內存,使用bzero和memset對服務器性能影響差距可能會很大。
另外程序中的一些查詢操做,採用不一樣的數據結構,能夠實現時間和空間上的相互轉化,從而影響服務器的性能。
3. Linux下的數據監控工具
3.1. Vmstat
Vmstat,virtual memmory statistics(虛擬內存統計),主要是對操做系統的內存信息、進程狀態、cpu活動等進行監視,可是它不能對某個進程進行深刻的分析。
Procs中r列表示運行和等待CPU時間片的進程數,若是r值長期大於CPU個數,說明CPU資源不夠用啦,能夠適當增長CPU數量。
Procs中b列表示當前等待資源的進程數,包括等待I/O,內存等。Swpd列表示切換到內存交換區的KB數,通常si,so爲0的話基本不影響系統的性能。Cache是page cache的內存數量,Linux會把空閒的物理內存的一部分拿來作文件和目錄的緩存,以便提升程序執行的性能。若是cache的值較大的話,說明緩存了太多的文件,若是bi值小的話,說明文件系統效率比較高。Si是每秒從磁盤讀入虛擬內存的大小,若是這個值一直大於0,表示物理內存不夠用或者內存泄露了,須要查找耗內存進程解決掉。Bi,bo是表示從塊設備讀入數據的總量以及寫到塊設備的數據總量。若是bi+bo值比較大,並且wa值也比較大的話,說明系統磁盤I/O可能有問題,性能不高。
In和cs是每秒鐘的設備中斷數以及上下文切換數。它們很大的話,表面內核消耗的CPU時間較多。
3.2. Top
Top是一個動態顯示過程,便可以經過用戶按鍵來不斷刷新當前狀態。它能夠按照系統中當前進程的CPU利用率以及佔用的內存大小進行排序,能夠比較快速定位出系統響應遲鈍的緣由。若是在前臺執行該命令,它將獨佔前臺,直到用戶終止該程序爲止。
top是一個顯示數據較多的工具,第一行顯示的是系統的開機運行時間,機器的CPU負載信息;第二行顯示當前系統任務的總數,以及各個狀態的進程數;第三行顯示的是CPU資源的使用狀況總覽;第四行顯示內存的使用狀況總覽;第五行顯示的是內存交換區的使用狀況總覽;後面開始是每一個進程對資源使用的狀況。
3.3. Nmon
Nmon提供對CPU、內存、網絡、磁盤等系統資源佔用狀況分析,相比其餘Linux命令獲取到的數據,nmon的功能更爲集中、配置性更強。經過nmon採集到數據以後能夠在windows系統中使用nmon_analyser作數據的展現以及分析工做,可視化效果比較好。
因爲通常Linux系統都不自帶nmon,使用以前須要下載安裝。
3.4. Uptime
Uptime命令顯示系統已經運行了多長時間,它依次顯示當前時間、系統已經運行了多長時間、目前有多少登錄用戶、系統在過去的1分鐘、5分鐘和15分鐘內的平均負載。
關於系統平均負載,它表示在特定時間間隔內運行隊列中的平均進程數。若是一個進程知足如下條件則其就會位於運行隊列中:沒有在等待I/O操做的結果;沒有主動進入等待狀態;沒有被中止。
3.5. Netstat
Netstat命令能夠顯示本機的網絡鏈接狀況,監聽端口以及路由表等各類網絡相關信息。Netstat用於顯示與IP、TCP、UDP和ICMP協議相關的統計數據,通常用於檢驗本機各端口的網絡鏈接狀況。
比較經常使用的能夠用次命令查看當前開啓監聽的服務器進程信息以及端口信息。
3.6. Free
Free是監控Linux使用狀況最經常使用的命令。「Free -m」能夠查看以M爲單位的使用狀況,這裏主要觀察free和cached兩列。
通常來講,若是應用程序可用內存/系統物理內存>70%時,代表目前系統內存資源比較充足,不影響系統性能;若是應用程序可用內存/系統物理內存<20%時,代表目前系統內存資源比較緊缺,須要釋放其餘程序內存或者增長內存;若是應用程序可用內存/系統物理內存在20%-70%之間,代表目前系統的內存資源基本知足應用需求,暫時不影響系統的性能。
3.7. Sar
Sar也是一個強大的分析系統性能的工具,它能夠比較全面的獲取系統的CPU,運行隊列,磁盤IO,分頁,內存,CPU中斷,網絡等多項數據。
上圖是使用sar獲取系統CPU的總體負責狀況,每隔1秒統計一次,統計3次,最後會給出3次的平均值。須要查看其餘的數據能夠查看手冊使用。
3.8. Iostat
Iostat是I/O statistics的縮寫,主要功能是對系統的磁盤I/O操做進行監控。它的輸出主要顯示磁盤讀寫操做的統計信息,同時也會給出CPU的使用狀況。
這裏顯示的是查看CPU和磁盤的信息,統計間隔2秒,共3次。
3.9. Valgrind
Valgrind是一款普遍用於監控程序運行過程進行內存調試、內存泄漏檢測以及性能分析的工具。它會給出內存泄漏的統計,包括definitely lost,indirectly lost,possibly lost,still reachable ,suppressed等,咱們可使用valgrind來測試程序中內存不規範使用的部分。同時對於地址越界問題也能夠經過valgrind掃出來,它會統計invalid write的狀況。
4. 服務器的性能優化
在優化以前,先要搞清楚服務器的具體業務需求是什麼,據此來優化其中的短板。
4.1. 存儲的優化
IO相對來講比較耗時,咱們都知道越靠近CPU的存儲,其訪問速度越快,可是其價格越貴。下圖來展現了不一樣存儲的容量以及訪問時間。
目前不少同窗在優化服務器性能的時候都會從存儲這方面入手。
儲存的容量以及訪問時間
4.1.1. 用內存換時間
4.1.1.1. 增長緩存
不少web應用是有大量的靜態內容,這些靜態內容主要都是一些小文件,而且會被頻繁的讀,採用Apache以及nginx做爲web服務器。在web訪問量不大的時候,這兩個http服務器能夠說是很是的迅速和高效,若是負載量很大的時候,咱們能夠採用在前端搭建cache服務器,將服務器中的靜態資源文件緩存到操做系統內存中直接進行讀操做,由於直接從內存讀取數據的速度要遠大於從硬盤讀取。這個其實也是增長內存的成原本下降訪問磁盤帶來的時間消耗。
4.1.1.2. 內存數據庫內存數據庫,其實就是將數據放在內存中直接操做的數據庫。相對於磁盤,內存的數據讀寫速度要高出幾個數量級,將數據保存在內存中相比從磁盤上訪問可以極大地提升應用的性能。內存數據庫拋棄了磁盤數據管理的傳統方式,基於所有數據都在內存中從新設計了體系結構,而且在數據緩存、快速算法、並行操做方面也進行了相應的改進,因此數據處理速度比傳統數據庫的數據處理速度要快不少。可是安全性的問題能夠說是內存數據庫最大的硬傷。由於內存自己有掉電丟失的自然缺陷,所以咱們在使用內存數據庫的時候,一般須要,提早對內存上的數據採起一些保護機制,好比備份,記錄日誌,熱備或集羣,與磁盤數據庫同步等方式。
對於一些重要性不高可是又想要快速響應用戶請求的部分數據能夠考慮內存數據庫來存儲,同時能夠按期把數據固化到磁盤。
4.1.1.3. RDD
這裏圖個新鮮,說說內存換時間在大數據雲計算相關領域的一些應用。Spark最近很火,它的核心要數RDD了,RDD最先來源與Berkeley實驗室的一篇論文《Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing》。現有的數據流系統對兩種應用的處理並不高效:一是迭代式算法,這在圖應用和機器學習領域很常見;二是交互式數據挖掘工具。這兩種狀況下,將數據保存在內存中可以極大地提升性能。這裏不詳細說RDD了,只是想說程序員一直是覬覦內存的讀取速度的。
4.1.2. 使用SSD等
除了對內存方面的優化,還能夠對磁盤這邊進行優化。跟傳統機械硬盤相比,固態硬盤具備快速讀寫、質量輕、能耗低以及體積小等特色。可是ssd的價格相比傳統機械硬盤要貴,有條件的可使用ssd來代替機械硬盤。
4.2. 數據庫優化大部分的服務器請求最終都是要落到數據庫中,隨着數據量的增長,數據庫的訪問速度也會愈來愈慢。想要提高請求處理速度,必需要對原來的單表進行動刀了。目前主流的Linux服務器使用的數據庫要屬mysql了,若是咱們使用mysql存儲的數據單個表的記錄達到千萬級別的話,查詢速度會很慢的。根據業務上合適的規則對數據庫進行分區分表,能夠有效提升數據庫的訪問速度,提高服務器的總體性能。
另外對於業務上查詢請求,在建表的時候能夠根據相關需求設置索引等,以提升查詢速度。
4.3. 利用多核優點
如今運行服務器的主流機器配置都是多核CPU的,咱們在設計服務器的時候能夠利用多核心的特色,採用多進程或者多線程的框架。
關於選擇多線程仍是多進程能夠根據實際的需求,結合各自的優缺點進行選擇。
對於多線程的使用,特別是使用線程池的時候能夠經過測試不一樣線程池服務器的性能來設置合適的線程池。
4.4. 選擇合適的IO模型
《UNIX網絡編程卷1:套接字聯網API》中有一幅圖比較經典。
IO模型
阻塞I/O模型:數據沒到達以前,I/O一直阻塞,若是數據到達,則會返回。典型的是recvfrom,通常的默認都是阻塞的。
非阻塞的I/O模型:和阻塞相反,只要不能獲得結果的時候,I/O馬上返回。不會阻塞當前線程。IO複用模型:也就是本身要學習的部分。多路複用的意思是,將多路信號合併到一路上進行處理,相似多個管道聚集到一個管道,與之相反的是多路分解。IO複用模型主要是select,poll,epoll;對一個IO端口,兩次調用,兩次返回,比阻塞IO並無什麼優越性;關鍵是能實現同時對多個IO端口進行監聽;函數也會使進程阻塞,可是和阻塞I/O所不一樣的的,這兩個函數能夠同時阻塞多個I/O操做。並且能夠同時對多個讀操做,多個寫操做的I/O函數進行檢測,直到有數據可讀或可寫時,才真正調用I/O操做函數。信號驅動:首先開啓套接口信號驅動I/O功能,並經過系統調用sigaction安裝一個信號處理函數。當數據報準備好被讀時,就爲該進程生成一個SIGIO信號。隨便可以在信號處理程序中調用recvfrom來讀數據報,井通知主循環數據已準備好被處理中。也能夠通知主循環,讓它來讀數據報。異步的IO模型:告知內核啓動某個操做,並讓內核在整個操做完成後(包括將數據從內核拷貝到用戶本身的緩衝區)通知咱們。
這裏並非說必定要用某個模型,epoll也並非在全部狀況下都比select性能要好的,在選擇的時候仍是要結合業務需求來。
4.5. 分佈式部署程序
當單機服務器已經找不到合適的優化點時,咱們能夠經過分佈式部署來提升服務器的響應能力。優秀的服務器開發都會爲本身的服務器的擴容,容災提出一些解決方案。我的以爲服務器設計的時候簡單點比較好,這樣後期擴容的時候會很方便。
針對服務器性能測試,騰訊WeTest運用了沉澱十多年的內部實踐經驗總結,經過基於真實業務場景和用戶行爲進行壓力測試,幫助遊戲開發者發現服務器端的性能瓶頸,進行鍼對性的性能調優,下降服務器採購和維護成本,提升用戶留存和轉化率。