本文中,小編蒐集了7個最有影響的衡量標註,讓你能夠不依賴日誌文件來了解應用程序。如今,讓咱們看看這些性能指標,並瞭解如何查看並收集它們:java
1.響應時間和吞吐量python
根據應用程序的響應時間能夠知道程序完成傳輸數據所用的時間。也能夠從HTTP請求級別,或者成爲數據庫級別來看。對那些緩慢的查詢你須要作一些優化來縮短期。吞吐量是另外一個角度衡量傳輸數據的指標,是指單位時間內系統處理的客戶請求的數量。面試
咱們可使用APMs(例如New Relic或AppDynamics)來衡量這些指標。使用這些工具,你能夠在主報告儀表板中將平均響應時間與昨天的甚至上週的直接進行對比。這有助於咱們觀察新的部署是否會影響到咱們的應用程序。你能夠看到網絡傳輸的百分比,測量HTTP完成請求須要多長時間。數據庫
推薦工具:服務器
AppDynamics網絡
New Relicdom
Ruxit工具
New Relic報告:Web傳輸百分比和吞吐量性能
2.平均負載學習
第二個應用普遍的指標是平均負載。咱們習慣上會把平均負載分爲這三步測量,分別是第5分鐘、第15分鐘和最後1分鐘。要保證數量低於機器的內核數。一旦超過內核數,機器就會運行在壓力狀態下。
除了簡單測量CPU使用率,還須要關注每一個內核的隊列中有多少進程。在內核使用率都是100%的狀況下,隊列中只有1個任務和有6個任務有很大不一樣。所以,平均負載不能只考慮CPU使用率。
推薦工具:
3.錯誤率
大多數開發人員判斷錯誤率是根據HTTP傳輸總失敗百分比。可是他們忽略了一個更深層的東西:特定傳輸的錯誤率。這直接影響到您應用程序的運行情況。這能夠顯示出代碼方法的錯誤以及錯誤或異常出現的次數。
但單純的錯誤率數據對咱們沒有多大幫助。最重要的是咱們要找到它們的根源並解決問題。隨着Takipi的運行,咱們要在日誌文件中需找線索。你能夠找到全部關於服務器狀態的信息,包括堆棧跟蹤、源代碼和變量值。
推薦工具:
4.GC率和暫停時間
異常行爲垃圾收集器應用程序的吞吐量和響應時間採起深潛的主要緣由之一。瞭解GC暫停頻率和持續時間的關鍵是分析GC日誌文件。要分析它們,你須要收集GC日誌和JVM參數。你要注意觀察不一樣指標之間的數據是如何相互影響的。
推薦工具:
jClarity Censum
GCViewer
5.業務指標
應用程序的性能不徹底取決於響應時間和錯誤率。業務指標也是一方面,例如收益、用戶數。
推薦工具:
Grafana
The ELK stack
Datadog
Librato
6.正常運行時間和服務運行狀態
這一指標奠基了整個應用程序性能的基礎。不只能夠當作一個提醒指標,也可讓你定義一段時間內的SKA。咱們可使用Pingdom的servlet功能進行運行狀態檢查。咱們能夠查到應用程序的全部傳輸,包括數據庫和S3。
推薦工具:
7.日誌大小
日誌有一個缺點,它是一直在增長的。當您的服務器啓動塞滿了垃圾,一切都慢下來。所以,咱們須要密切的關注日誌大小。
目前一般的解決辦法是使用logstash劃分使用日誌,並將它們發送並存儲在Splunk、ELK或其餘的日誌管理工具中。
推薦工具:
Splunk
Sumo Logic
Loggly
歡迎小夥伴們評論區留言推薦本身經常使用的java工具
【完】
歡迎關注我的公衆號【菜鳥名企夢】,公衆號專一:互聯網求職面經、java、python、爬蟲、大數據等技術分享**: 公衆號**菜鳥名企夢
後臺發送「csdn」便可免費領取【csdn】和【百度文庫】下載服務; 公衆號菜鳥名企夢
後臺發送「資料」:便可領取5T精品學習資料**、java面試考點和java面經總結,以及幾十個java、大數據項目,資料很全,你想找的幾乎都有
往期精選