淺談OpenTelemetry的意義

前言

以前一直在思考對於一家互聯網公司如何實戰落地AIOPS,曾經在某廠踐行過一些關於融合監控,日誌和trace三個領域,而後結合算法實現AIOPS的工做。冥冥之中,總感受國外某些大廠,會折騰出一個標準,至於這個標準是什麼,卻不能特別清晰地說出來。
直到看到OpenTelemetry這個項目,結合本身以前的經歷,感受這個項目對於運維,對於服務治理,對於AIOPS,相當重要。算法

OpenTelemetry 是什麼?

兩個有助於爲雲原生操做提供指標的開源項目已合併爲一個項目。 Google的OpenCensus和Cloud Native Computing Foundation的OpenTracing的融合將被稱爲OpenTelemetry,並將由CNCF管理。後端

聚合背後的想法是建立一個完整的遙測系統,用於監控微服務和其餘分佈式系統,前兩個項目的組織者說。它還將使最終用戶的儀表服務過程更容易一些,特別是在已經很是豐富的雲原生場景中。運維

遙測數據有多種形式,用戶在進行整合時不想考慮多個品牌。他們應該只與一個項目集成,以得到他們想要的遙測。分佈式

最終OpenTelemetry由一組集成的API和庫以及經過代理和收集器的收集機制組成。這些組件用於生成,收集和描述有關分佈式系統的遙測。該數據包括未來的基本上下文傳播,分佈式跟蹤,度量和其餘信號。 OpenTelemetry旨在使您能夠輕鬆地從您的服務和您選擇的後端獲取關鍵的遙測數據。對於每種受支持的語言,它提供了一組API,庫和數據規範,開發人員能夠利用他們認爲合適的任何組件。微服務

PS:性能

  • 不過OpenTelemetry目前還處於設計階段,差很少要等2020年,才能夠生產可用。
  • 看規劃第一階段並不包含logging的實現。

OpenTelemetry對於服務治理的可觀察性的意義

術語「可觀察性」源於控制理論學科,指的是系統在其產生的遙測基礎上的理解程度。設計

在軟件中,可觀察性一般是指由服務產生的遙測,並分爲三個主要的垂直:代理

  • 跟蹤(又稱分佈式跟蹤)提供對系統請求的完整生命週期(即跟蹤)的深刻了解,使您能夠查明故障和性能問題。
  • 監控(度量標準)提供有關係統內部運行的進程的定量信息,包括計數器,儀表和直方圖。
  • 日誌記錄能夠深刻了解進程發出的特定於應用程序的消息。

這些垂直方向緊密相連。度量標準可用於精肯定位,例如,行爲不當行爲的子集。與這些跟蹤關聯的日誌可能有助於找到此行爲的根本緣由。而後,能夠根據此發現配置新指標,以便下次更早地發現此問題。日誌

OpenTelemetry旨在將全部三個垂直組合成一組系統組件和特定於語言的遙測庫。它旨在取代專一於跟蹤的OpenTracing項目和專一於跟蹤和指標的OpenCensus項目。生命週期

結語

結合同爲cncf項目的prometheus(metrics領域),jaeger(trace), fluentd(log),OpenTelemetry的願景基本上具有很好的實戰基礎。融合merics和trace和log三大領域,至少在如下兩個方向是有很是大的意義:

  • 根因分析
  • 故障預測

而對於一個互聯網公司也有很大的啓發,應該提早準備,在選型和實戰merics和trace和log技術方案的時候,考慮到OpenTelemetry標準。

相關文章
相關標籤/搜索