談談後臺服務的灰度發佈與監控

版權聲明:本文由廖念波原創文章,轉載請註明出處: 
文章原文連接:https://www.qcloud.com/community/article/149程序員

來源:騰雲閣 https://www.qcloud.com/community服務器

 

爲何要有灰度發佈與監控

《海量服務之道》裏的《灰度發佈》和《全方位監控》這兩門課想必技術同事都已經學習過了。我以爲這兩個方法論是很是具備行業特點的,也是很是具備騰訊特點的。微信

筆者在加入騰訊QQ後臺團隊以前,曾經在電信行業、金融行業作過幾年開發工做。剛進入騰訊時,以爲技術上不少地方讓人耳目一新:框架

  1. 後臺系統都是部署在很是多的廉價服務器上,每一個人都會管理很是多的機器,讓人以爲頗有成就感很富有運維

  2. 有比較精確的設備預算計算模型,每一個服務器的性能在考慮容災冗餘的前提下,一般被壓榨到剛恰好,負責人會深刻的洞悉整個系統的性能、容災、柔性等方方面面。能負責一個海量的系統是很榮耀的一件事情性能

  3. 沒有專職的測試人員,通過開發者自測後,灰度發佈加詳細的監控,主要的系統幾乎每兩週都會被髮布一輪,做爲後臺技術人員,本身的工做直接影響數以億計的用戶,有點手握核彈處於上帝視角的感受學習

  4. 監控系統(咱們內部一個叫monitor的系統)真的是太方便了,一條條曲線直觀的展現整個系統運做的各類指標,若是有異常短信和電話就會響起來,讓人以爲一切盡在掌控,有一種面對着大量儀表盤操控着航母遊弋或者是戰鬥機掛着核彈翱翔的感受。測試

好了,趕忙結束程序員意淫的美好感受,我想說的重點是:灰度發佈和監控真的是互聯網海量服務必備的兩大利器,可以極大的提升後臺服務可用性和運營水平。spa

固然,灰度發佈不僅是一部分一部分的發佈新代碼,監控也不僅是繪製曲線和告警短信那麼簡單,這裏面深究下去會有不少東西,背後的哲學是持續交付、用戶測試和盡在掌控。插件

毫秒服務引擎(msec, 取英文名Mass Service Engine in Cluster的首字母組合)是騰訊一個開源框架,其創做衝動和構建經驗,來自QQ後臺團隊超過10年的運營思考。灰度發佈能監控是毫秒服務引擎設計的重要考量點。

毫秒引擎裏是怎麼作的?

灰度發佈

在服務配置管理頁點擊「制定發佈計劃」

選擇這一次灰度要發佈的目標機器和發佈類型:

在接下來的嚮導中選擇正確版本的配置文件、外部庫、業務插件等,這樣就完成了發佈計劃的製做:

接着,點擊菜單 「運維->發佈」,能夠查詢全部發布計劃,對於已經發布的計劃,能夠作回滾操做。點擊詳情能夠查看發佈計劃更詳細信息,並執行發佈:

監控

關於監控,在第二篇:RPC和路由管理那裏講得已經比較詳細了,這裏不贅述,只說明一下:除了RPC和框架自己自動上報的一些信息,還支持業務自定義上報信息(例如我想上報第28級VIP用戶登陸的次數),且支持對於關鍵指標的波動、最大值、最小值設置告警:

結語

灰度發佈和監控是互聯網海量服務必備的兩大利器,可以極大的提升後臺服務可用性和運營水平,背後的哲學是持續交付、用戶測試和盡在掌控。藉助毫秒服務引擎,初創團隊能夠快速得到這兩大利器。詳細的可見騰訊雲服務市場毫秒服務引擎官網,或者微信公衆號:msec-engine

相關文章
相關標籤/搜索