.NetCore實踐篇:成功解決分佈式監控ZipKin聚合依賴問題(三)

前言

讀本篇文章以前,能夠先讀前兩篇文章。爲了照顧沒看過的朋友,我也會稍做複習。
思考大綱: .Net架構篇:思考如何設計一款實用的分佈式監控系統?
實踐篇一:.NetCore實踐篇:分佈式監控客戶端ZipkinTracer從入門到放棄之路
實踐篇二:.NetCore實踐篇:分佈式監控系統zipkin踩坑之路(二)
上一章節,咱們遺留了兩個問題,php

聚合調用span傳送到zipkin時,沒有產生聚合的span。css

菜單dependencies沒有聚合數據,zipkin-dependencies啓動失敗問題。html

很慶幸,這兩個問題都在本篇文章獲得完美解決。沒有什麼比一步一步解決問題更開心了,我又收集了一堆寶貴的連接。很是感謝社區,因此我也將本身的實踐之路分享出來,爲.net社區繁榮增一點力氣。java

zipkin複習

zipkin爲分佈式鏈路調用監控系統,聚合各業務系統調用延遲數據,達到鏈路調用監控跟蹤;
zipkin經過採集跟蹤數據能夠幫助開發者深刻了解在分佈式系統中某一個特定的請求時如何執行的;mysql

詳情以下
zipkin參考
zipkin官網linux

zipkin4net複習

zipkin4net是.NET客戶端庫。git

它爲您提供:github

  • Zipkin 原語(跨度,註釋,二進制註釋,......)【Zipkin primitives (spans, annotations, binary annotations, ...)】
  • 異步跟蹤發送
  • 跟蹤傳輸抽象

詳情以下:
zipkin4netsql

zipkin-dependencies複習

這是一個Spark做業,它將從您的數據存儲區收集跨度,分析服務之間的連接,並存儲它們以供之後在Web UI中呈現(例如http://localhost:8080/dependency)。
什麼是Spark?
Apache Spark 是專爲大規模數據處理而設計的快速通用的計算引擎。
此做業以UTC時間分析當天的全部跟蹤。這意味着您應該將其安排在UTC午夜以前運行。
支持全部Zipkin 存儲組件,包括Cassandra,MySQL和Elasticsearch。mongodb

詳情以下:
zipkin-dependencies

今日重點--成功啓動zipkin-dependencies

上次被zipkin-dependencies的啓動問題卡了很晚,就結束了那篇文章,今天繼續解決問題。我從網上搜到一篇相似的博文 部署生產環境時踩到的一些坑,裏面提到直接在tomcat的catalina.sh的JAVA_OPTS註釋處,加一行JAVA_OPTS="-server -Xms1024m -Xmx1624m -XX:PermSize=128M -XX:MaxPermSize=256m",便可解決。

# JAVA_OPTS (Optional) Java runtime options used when any command
# is executed.
# Include here and not in CATALINA_OPTS all options, that
# should be used by Tomcat and also by the stop process,
# the version command etc.
# Most options should go into CATALINA_OPTS.
JAVA_OPTS="-server -Xms1024m -Xmx1624m -XX:PermSize=128M -XX:MaxPermSize=256m"

tomcat啓動成功。

[root@izwz9fwifc2eniq3lbdzmgz bin]# ./startup.sh 
Using CATALINA_BASE: /usr/local/tomcat/apache-tomcat-8.5.32
Using CATALINA_HOME: /usr/local/tomcat/apache-tomcat-8.5.32
Using CATALINA_TMPDIR: /usr/local/tomcat/apache-tomcat-8.5.32/temp
Using JRE_HOME: /usr/lib/jdk1.8.0_181
Using CLASSPATH: /usr/local/tomcat/apache-tomcat-8.5.32/bin/bootstrap.jar:/usr/local/tomcat/apache-tomcat-8.5.32/bin/tomcat-juli.jar
Tomcat started.

後來又搜到這條連接how to increase heap size?
原來直接在執行java命令時,追加-Xmx就好了,腦殼太死板,想不到這個點。

[root@izwz9fwifc2eniq3lbdzmgz cusD]# java -Xmx1024m -version
java version "1.8.0_181"
Java(TM) SE Runtime Environment (build 1.8.0_181-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.181-b13, mixed mode)

提示內存不足,分配失敗。

[root@izwz9fwifc2eniq3lbdzmgz cusD]# STORAGE_TYPE=cassandra3 java -Xmx1024m -Xms1024m -jar zipkin-dependencies.jar `date -u -d '1 day ago' +%F`
Java HotSpot(TM) 64-Bit Server VM warning: INFO: os::commit_memory(0x00000000d5550000, 715849728, 0) failed; error='Cannot allocate memory' (errno=12)
#
# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 715849728 bytes for committing reserved memory.
# An error report file with more information is saved as:
# /cusD/hs_err_pid6871.log

解決步驟:

執行剛纔的vi catalina.sh,清理掉設置的JAVA_OPTs信息,關掉mysql,重啓tomcat等步驟。利用freetop查看內存消耗。

[root@izwz9fwifc2eniq3lbdzmgz cusD]# free -h
total used free shared buff/cache available
Mem: 1.8G 228M 1.2G 388K 396M 1.4G
Swap: 0B 0B 0B
[root@izwz9fwifc2eniq3lbdzmgz cusD]# STORAGE_TYPE=cassandra3 java -Xmx512m -Xms128m -jar zipkin-dependencies.jar `date -u -d '1 day ago' +%F`
18/09/17 16:42:21 INFO CassandraDependenciesJob: Running Dependencies job for 2018-09-16: 1537056000000000 ≤ Span.timestamp 1537142399999999
18/09/17 16:42:21 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
18/09/17 16:42:22 WARN Java7Support: Unable to load JDK7 types (annotations, java.nio.file.Path): no Java7 support added
Exception in thread "main" java.io.IOException: Failed to open native connection to Cassandra at {127.0.0.1}:9042

未能加載JDK7 types,不過日誌級別爲Warn,能夠忽略。

啓動成功後,dependency依然沒有數據, 須要繼續查詢問題。

今日重點--深思流程解決span聚合問題

上次是因爲啓動問題,今天解決了啓動問題,再看不到數據,就須要深思整個流程了。
再讓咱們回憶下下面這張圖,parentid爲空,是否是意味着跨站點須要強指定parentid或站點名稱?


繼續翻看zipkin4Net示例代碼,發現使用了 IHttpClientFactory CreateClient 方法,又在 ConfigureServices 裏指定了applicationName,也許這纔是能顯示出聚合站點的關鍵!

namespace frontend
{
public class Startup : CommonStartup
{
public override void ConfigureServices(IServiceCollection services) {
services.AddHttpClient("Tracer").AddHttpMessageHandler(provider =>
TracingHandler.WithoutInnerHandler(provider.GetService<IConfiguration>()["applicationName"]));
}
protected override void Run(IApplicationBuilder app, IConfiguration config) {
app.Run(async (context) =>
{
var callServiceUrl = config["callServiceUrl"];
var clientFactory = app.ApplicationServices.GetService<IHttpClientFactory>();
using (var httpClient = clientFactory.CreateClient("Tracer"))
{
var response = await httpClient.GetAsync(callServiceUrl);
if (!response.IsSuccessStatusCode)
{
await context.Response.WriteAsync(response.ReasonPhrase);
}
else
{
var content = await response.Content.ReadAsStringAsync();
await context.Response.WriteAsync(content);
}
}
});
}
}
}

繼續按照示例代碼,修改咱們的邏輯,封裝一個可供其餘站點調用的HTTPHelper幫助類,提供能追蹤站點的GetAsync方法,

namespace Demo.ZipkinCommon
{
public class HTTPHelper : ControllerBase
{
/// <summary>
/// 獲取
/// </summary>
/// <param name="url"></param>
/// <param name="keyValues"></param>
/// <param name="timeout"></param>
/// <param name="encoding"></param>
/// <returns></returns>
public static async Task<string> GetAsync(string url, Dictionary<string, string> keyValues, int timeout = 0, Encoding encoding = null)
{
if (encoding == null)
{
encoding = Encoding.UTF8;
}
var appName = ConfigureSettings.AppSettingConfig["applicationName"];
using (var httpClient = new HttpClient(new TracingHandler(appName)))
{
var response = await httpClient.GetAsync(url);
if (!response.IsSuccessStatusCode)
{
return response.ReasonPhrase;
}
else
{
var content = await response.Content.ReadAsStringAsync();
return content;
}
}
}
}
}

兩個站點的Add方法作出修正,而後查看監控數據。

[HttpPost]
public IActionResult Add([FromBody]User user)
{
_userService.AddUser(user);
//模擬調用其餘站點請求。
var url = $"{ConfigEx.WebSite}/user/get?id={user.Id}";
var content = HTTPHelper.GetAsync(url, null);
return Content(content.Result);
}

監控spans有兩級了,達到了咱們要的效果
監控層級

點開查看效果
站點聚合
聚合效果圖

經測試,重啓linux後,不開啓zipkin-dependencies的狀況下,內存模式下依然能實時聚合,上篇文章的結論是本人不熟悉所致使。

參考資料

源碼

源碼已上傳範存威的github

總結

基於內存模型的存儲,執行效果演示到此結束。在這個過程當中,提高了我java一些知識,.NetCore依賴注入,加深了zipkin總體流程的理解。
下篇文件大致方向是zipkin數據持久化和集羣,以及zipkin如何跟蹤mongodb和Redis。

本篇到此結束,感謝觀看!

相關文章
相關標籤/搜索