微服務架構的兩大解耦利器與最佳實踐

這幾年,微服務架構這個術語漸成熱門詞彙,但它不是一個全新架構,更不是一個包治百病的架構。那麼,微服務架構究竟可以解決什麼問題,又帶來哪些痛點?
nginx

本文將與你們談談這個問題,以及微服務架構的兩大解耦利器配置中心和消息總線的最佳實踐。web

微服務架構解決的問題與帶來的痛點數據庫


後端

互聯網高可用架構爲何要服務化?瀏覽器


上圖是互聯網典型的高可用架構,大部分公司若是沒有使用微服務,正在使用這樣的架構:緩存

  • 用戶端是瀏覽器 browser,APP 客戶端服務器

  • 後端入口是高可用的 nginx 集羣,用於作反向代理微信

  • 中間核心是高可用的 web-server 集羣,研發工程師主要在這一層進行編碼工做網絡

  • 後端存儲是高可用的 db 集羣,數據存儲在這一層。更典型的公司,web-server 層是經過 DAO/ORM 等技術來訪問數據庫。架構


最初的架構都沒有服務層,這樣的架構會遇到怎樣的痛點?對於沒有使用微服務架構的公司來講,要不要升級到微服務架構呢?


58 同城和 58 到家的架構痛點


回答這個問題以前,先來看看您是否遇到和 58 同城及 58 到家相似的架構痛點:


圖一,代碼拷貝。A、B、C   業務線,若是沒有微服務架構,可能要直接訪問數據庫裏的數據來實現本身的業務需求。拿訪問用戶數據舉例,用戶中心包括全部公司必備的業務,好比登錄、註冊、查找用戶信息等。如某業務線須要訪問用戶信息,須要經過封裝用戶訪問代碼模塊實現。如業務繁多,每一個業務線都須要訪問用戶信息,潛在的會存在代碼拷貝問題。


圖二,底層複雜性擴散。隨着流量的增加,須要加入緩存,對數據的訪問模式和流程都會帶來影響。從直接訪問數據庫,變到先訪問緩存再訪問數據庫。這樣的複雜性,全部的業務都需關注,代碼都要從新作一遍。包括數據量增大後,要進行的水平線切分、分庫、分表,存儲引擎的變化等複雜性,要擴展到業務線。


圖三,代碼庫耦合。58 同城遇到圖一和圖二問題,最初想到的方案並非微服務,而是將相互拷貝的複雜性代碼封裝到一個代碼庫(DLL 或 jar 包),實現統一的相關功能,屏蔽複雜性。

拷貝代碼的好處是代碼獨立演化,作改動互不影響。弊端是一旦用上庫,業務就會耦合在一塊兒,因共用jar包,一旦其中某個業務升級,其餘的業務就可能受影響。


圖四,數據庫耦合。業務線不僅訪問 user 數據,還會結合本身的業務訪問本身的數據:典型的狀況是經過 join 數據表來實現各自業務線的一些業務邏輯。這樣的話:

  • 業務線 A 的 table-user 與 table-A 耦合在了一塊兒;

  • 業務線 B 的 table-user 與 table-B 耦合在了一塊兒;

  • 業務線 C 的 table-user 與 table-C 耦合在了一塊兒;


結果就是:table-user,table-A,table-B,table-C都耦合在了一塊兒。隨着數據量的愈來愈大,業務線 ABC 數據庫沒法進行垂直拆分,必須使用一個大庫(瘋了,一個大庫 300 多個業務表 =_=)。


圖五,SQL 質量得不到保證,業務之間互相影響。由業務方拼裝的 SQL 語句調用方式,經過 ORM(對象關係映射)的方法生成 SQL 語句數據庫,這個庫是共用的,會影響全部的業務線。一旦某業務有慢 SQL 出現,其餘業務就會受影響。


回到要不要作微服務升級的問題,若是你們所負責的系統、模塊或公司也存在以上的這些問題,建議考慮作服務化,在中間加一個服務層,全部調用不容許直接鏈接底層庫。服務化還有一個很重要的特色就是數據庫私有化,任何人不能跨越服務程序,干預數據庫。想調用要經過接口來實現,當數據庫性能變差,直接加一臺機器,把數據庫遷移,對調用方不會產生影響。


服務化解決了哪些問題


在 58 同城,用戶中心由專門的部門負責,是全公司、全業務依賴比較重的服務,它對代碼要求和穩定性要求比較高。整個 SQL 語句是服務層控制,向上提供有限的服務接口和無限的性能

工程師要保障雖然提供用戶基礎數據的接口數是有限的,但調用方不須要關心底層細節,能夠認爲性能是無限的。至於如何擴容,就是服務層的事情了。

下圖是互聯網典型的服務化架構。以用戶中心爲例,用戶中心服務向上屏蔽底層技術的複雜性,上層經過 RPC 接口來調用服務,如同調用本地函數同樣,不須要關注分庫、分表、緩存。

業務方須要數據,把數據拼裝出來返回 APP/PC 端便可,能夠不關心數據存在哪裏,底層的複雜性也由用戶層來承擔。這樣一來,用戶庫只有用戶服務依賴,任何人不得跨越用戶服務來直接調用數據庫,就不會存在代碼拷貝、代碼庫、數據庫耦合的狀況。


微服務架構的兩大解耦利器

微服務雖然看上去很好,但也給系統帶來不少問題,如部署方面,愈來愈複雜,分層愈來愈多,處理時間也隨之增長。如網絡交互方面,運維負載性、追查問題等等。那麼:

  • 面對架構的耦合及複雜性如何來優化

  • 結構如何配置


接下來,咱們介紹配置中心最佳實踐與消息總線最佳實踐這兩大解耦利器


微服務架構解耦利器-配置中心最佳實踐


放棄 IP 鏈接服務,選擇內網域名。58  到家是創業公司,痛點和不少公司都很類似。其中一個場景是 IP 的變化。最初,IP 寫在配置文件中,經過某個 IP   或端口訪問數據與服務。當某臺機器出現問題,DB 同事會在新機器作部署,更換 IP。當某個服務或 IP 發生變化,就在配置文件中修改,重啓。


這裏的經驗分享是千萬不要用 IP 鏈接服務或數據庫,要選擇內網域名。這二者的區別在於:

  • 使用 IP 鏈接服務或數據庫的方式,全部的庫都和一個表有關聯,一旦機器掛掉或升高配,幾乎全部的業務都須要修改 IP。即使只是升級一個業務,都會嚴重影響其餘業務。

  • 選擇內網域名的方式後,若是換 IP,在運維層面能夠進行統一切斷,自動向上連接,上游的業務就不用動,也不受下層變更的影響。


配置私藏。以下圖是 58 到家早期改爲內網域名以後的配置文件。底層用戶服務或數據庫,是個高可用集羣,從 IP1 到 IP3。上游有三個依賴,兩個服務器,一個 Web 調用這個高可用集羣。Web 包含 WBE2.conf,調用 IP1,IP2,IP3。

在實踐過程當中,這種配置私藏的方式遇到兩個痛點:


  1. 升級時不知道被那個服務調用。當遇到流量愈來愈大,須要添加服務器時,如上圖,把  IP1 去掉,增長 IP4 和 IP5   的時候,須要通知上游。但問題在於流量不大時,由於對業務很是熟悉,工程師可以準確的找到服務器對應的負責人。隨着業務愈來愈複雜,工程師遇到出現了問題,不知道模塊被誰依賴的狀況。

  2. 升級時須要上游配合重啓。當增長 IP 時,須要找到對應的上游服務器負責人,通知他進行服務器重啓。公司成百上千的服務天天都有人在升級,當時的作法是採用建羣,隨時作通知,但這樣很影響研發同事寫代碼的效率。


全局配置。最開始底層的通用基礎服務,配置是寫在每一個站點;並且每一個應用私藏在配置文件裏,在升級過程當中,不知道誰私藏了這個配置。

面對這兩個痛點,58到家採用了下圖的解決方案:全局配置

全局配置也就是升級,只須要作流程與規範上的優化,對原有系統架構不產生任何影響,成本低且可平滑的慢慢遷移。

下圖的實現原理是把最初放在每一個服務器中的配置文件,抽取一個全局配置文件,作好目錄結構  global.conf。全部基礎服務配置若是由多個 global.conf 上游來讀取,必須經過 global.conf   來讀取。這樣全部的業務都在 global.conf,就能夠保障下一次升級可鏈接到最新。


那麼,在作擴容的時候,能不能實現調用方不須要升級呢?固然能夠,兩個小組件就能夠實現:

  • 監控全局文件的變化狀況,發生變化就進行回調,這樣用戶中心要配置修改的是全局配置。

  • 動態連接池組件。這是一個自身及調整流程成本都很低的組件,負載均衡也會在其中實現。

配置中心。全局配置對於服務提供方而言,問題依然沒有所有解決,擴容不須要重啓,卻仍不知道被誰依賴,不知道被誰訪問,就沒辦法作服務治理、限流等操做。這時,工程師就要引入配置中心,來解決這個問題。

配置中心思路是部署用戶中心承載全部配置,取代全部全局配置文件。這樣一來,全部都依賴配置中心上游,服務1,服務2,服務3,都再也不訪問global.conf,而是經過配置中心來拉取相關配置,配置變動,配置中心反向回調,調用方也不要重啓。

配置中心最佳實踐總結。配置中心是微服務架構中一個邏輯解耦但物理不解耦的利器。它原來在邏輯上依賴於本身的配置文件,依賴於下游,如今再也不向配置文件索要配置,而是全部調用方邏輯上只依賴於配置中心。物理上不解耦,是從配置文件拿到配置之後該連誰仍是連誰。


微服務架構解耦利器-消息總線最佳實踐


消息總線(Message Queue),後文稱 MQ,是一種跨進程的通訊機制,用於上下游傳遞消息。它也是微服務架構中很常見的解耦利器之一,在數據驅動的任務依賴、調用方不關注處理結果、關注結果的長時間調回等場景下使用。


數據驅動的任務依賴。大部分公司都有 BI、數據部門,天天都會跑一些日誌、數據庫,多個任務之間每每存在依賴關係,任務1先執行,依次是任務 二、任務 3 輸入,最終獲得結果。在沒有消息總線以前,大多公司和58到家的作法雷同,就是人工排班表。


人工排班表的弊端以下

  1. 本來執行時間是40分鐘,但爲保險,每一個人都會多加時間,致使任務總執行時間延長。

  2. 萬一某一任務的執行時間超過預留時間,接下來的任務不知情,會致使整個業務失敗。

  3. 多個業務之間可能有多重依賴,特別是在數據統計、數據分析過程當中,一些核心腳本執行完,後面一系列腳本才能執行。


以下圖,這種數據驅動的任務依賴很是適合使用MQ解耦。

  • task1準時開始,結束後發一個「task1 done」的消息

  • task2訂閱「task1 done」的消息,收到消息後第一時間啓動執行,結束後發一個「task2 done」的消息

  • task3同理


採用 MQ 的優勢是:

  • 不須要預留 buffer,上游任務執行完,下游任務總會在第一時間被執行

  • 依賴多個任務,被多個任務依賴都很好處理,只須要訂閱相關消息便可

  • 有任務執行時間變化,下游任務都不須要調整執行時間


須要特別說明的是,MQ 只用來傳遞上游任務執行完成的消息,並不用於傳遞真正的輸入輸出數據。

調用方不關注處理結果,這樣的狀況也適合消息總線來作解耦。舉例,58  同城的不少下游須要關注「用戶發佈帖子」這個事件,好比招聘用戶發佈帖子後,招聘業務要獎勵 58 豆;×××用戶發佈帖子後,×××業務要送 2   個置頂;二手用戶發佈帖子後,二手業務要修改用戶統計數據。


對於這類需求,常見的實現方式是使用調用關係:帖子發佈服務執行完成以後,調用下游招聘業務、×××業務、二手業務,來完成消息的通知,但事實上,這個通知是否正常、正確的執行,帖子發佈服務根本不關注。


這種方法的痛點是:

  • 帖子發佈流程的執行時間增長了

  • 下游服務宕機,可能致使帖子發佈服務受影響,上下游邏輯+物理依賴嚴重

  • 每當增長一個須要知道「帖子發佈成功」信息的下游,修改代碼的是帖子發佈服務,這一點是最噁心的,屬於架構設計中典型的依賴倒轉,誰用過誰痛誰知道(採用此法的請評論留言)


採用下圖的優化方案:MQ解耦

  • 帖子發佈成功後,向MQ發一個消息

  • 哪一個下游關注「帖子發佈成功」的消息,主動去MQ訂閱


採用 MQ 的優勢是:

  • 上游執行時間短

  • 上下游邏輯+物理解耦,除了與 MQ 有物理鏈接,模塊之間都不相互依賴

  • 新增一個下游消息關注方,上游不須要修改任何代碼


上游關注執行結果,但執行時間很長。有時候上游須要關注執行結果,但執行結果時間很長(典型的是調用離線處理,或者跨公網調用),也常用回調網關+MQ來解耦。

舉例:微信支付,跨公網調用微信的接口,執行時間會比較長,但調用方又很是關注執行結果,此時通常怎麼玩呢?


通常採用「回調網關+MQ」方案來解耦,新增任何對微信支付的調用,都不須要修改代碼。

  • 調用方直接跨公網調用微信接口
       

  • 微信返回調用成功,此時並不表明返回成功
       

  • 微信執行完成後,回調統一網關
       

  • 網關將返回結果通知 MQ
       

  • 請求方收到結果通知


這裏須要注意的是,不該該由回調網關來調用上游來通知結果,若是是這樣的話,每次新增調用方,回調網關都須要修改代碼,仍然會反向依賴,使用回調網關+ MQ 的方案。


綜上所述,兩個解耦利器的最佳實踐場景以下:


  • 配置中心是邏輯解耦,物理不解耦的微服務的利器。它能夠解決配置致使的系統耦合,架構反向依賴的問題,配置中心的演進過程,配置私藏到全局配置文件,到配置中心。
       

  • 消息總線是邏輯上解耦,物理上也解耦的微服務架構利器。它很是適合數據驅動的任務依賴,調用方不關注處理結果,或者調用方關注處理結果,可是回調的時間很長的場景。不適合調用方強烈關注執行結果的場景。


以上內容根據沈劍老師在 WOTA2017 「微服務架構實踐」專場的演講內容整理。 


沈劍,現任58到家技術委員會主席,高級技術總監,負責企業、支付、營銷和客戶關係等多個後端業務部門。本質,技術人一枚。互聯網架構技術專家,「架構師之路」公衆號做者。曾任百度高級工程師,58同城高級架構師,58同城技術委員會主席,58同城C2C技術部負責人。


相關文章
相關標籤/搜索