文|曹佳俊node
網易智慧企業資深服務端開發工程師react
背 景git
redis cluster簡介github
Redis cluster是redis官方提供集羣方案,設計上採用非中心化的架構,節點之間經過gossip協議交換互相的狀態,redis cluster使用數據分片的方式來構建集羣,集羣內置了16384個哈希槽,每一個key都屬於這16384這個哈希槽中的一個,經過crc16算法計算哈希值,再取餘可得每一個key歸屬的哈希槽;redis cluster支持動態加入新節點,動態遷移slot,自動的故障轉移等。redis
Redis cluster的架構要求客戶端須要直接與redis集羣中的每一個節點創建鏈接,而且當出現新增節點加入、節點宕機failover、slot遷移等事件時,客戶端須要可以經過redis cluster協議去更新本地的slot映射表,而且能處理ASK/MOVE語義,所以,咱們通常稱實現了redis cluster協議的客戶端爲smart redis client。算法
Redis cluster最多能夠構建超過100個主節點的集羣(超過以後gossip協議開銷過大,且可能引發集羣不穩定),按照單節點10G容量(單實例內存過大可能致使性能降低),單集羣最多能夠支撐1T左右的容量。spring
問 題segmentfault
Redis cluster有不少優勢(好比能夠構建大容量集羣,性能好,擴縮容靈活),可是當一些項目工程指望從redis遷移到redis cluster時,客戶端卻面臨着大量的改造工做,與此同時帶來的是須要大量的測試工做以及引入的新風險,這對於一些穩定運行的線上工程代價無疑是巨大的。後端
需 求緩存
爲了更方便的將業務遷移到redis cluster,最指望的是客戶端SDK的API徹底兼容redis/redis-cluster,spring提供的RedisTemplate是一個很好實現,可是對於沒有使用SpringRedisTemplate的項目,不少客戶端實現的redis和redis-cluster訪問API是不一致的(好比Java中流行的Jedis),這無形中提升了遷移工做的工做量和複雜性,此時redis cluster proxy是不錯的選擇,有了proxy,就能夠像操做單實例redis同樣操做redis cluster,客戶端程序就不須要作任何的修改。
固然,增長一層proxy,必然會致使性能有必定程度的降低,可是proxy做爲無狀態的服務,理論上能夠水平擴展,而且因爲proxy層的存在減小了後端redis server的鏈接數,在某些極限場景下甚至能提升redis集羣總體的吞吐量。此外,基於proxy,咱們還能夠作不少額外的事情:
功 能
介於上述各類緣由和需求,咱們基於netty開發了camellia-redis-proxy這樣一箇中間件,支持以下特性:
如何提高性能?
客戶端向camellia-redis-proxy發起一條請求,到收到請求回包的過程當中,依次經歷了以下過程:
能夠看到做爲一個proxy,大量的工做是在進行網絡IO的操做,爲了提高proxy的性能,作了如下工做:
多線程
咱們知道redis自己是單線程的,可是做爲一個proxy,徹底可使用多線程來充分利用多核CPU的性能,可是過多的線程引發沒必要要的上下文切換又會引發性能的降低。camellia-redis-proxy使用了netty的多線程reactor模型來確保服務器的處理性能,默認會開啓cpu核心數的work線程。 此外,若是服務器支持網卡多隊列,開啓它,能避免CPU不一樣核心之間的load不均衡;若是不支持,那麼將業務進程綁核到非CPU0的其餘核心,從而讓CPU0專心處理網卡中斷而不被業務進程過多的影響。
異步非阻塞
異步非阻塞的IO模型通常狀況下都是優於同步阻塞的IO模型,上述5個過程當中,除了協議轉發規則匹配這樣的內存計算,整個轉發流程都是異步非阻塞的,確保不會由於個別流程的阻塞影響整個服務。
流水線
咱們知道redis協議支持流水線(pipeline),pipeline的使用,能夠有效減小網絡開銷。camellia-redis-proxy也充分利用了這樣的特性,主要包括兩方面:
固然,全部這些批量和聚合的操做都須要保證請求和響應的一一對應。
TCP分包和大包處理
不論是上行協議解析,仍是來自後端redis的回包,特別是大包的場景,在碰到TCP分包時,利用合適的checkpoint的機制能夠有效減小重複解包的次數,提高性能。
異常處理和異常日誌合併
若是沒有有效的處理各類異常,在異常發生時也會致使服務器性能迅速降低。想象一個場景,咱們配置了90%的流量轉發給A集羣,10%的流量轉發到B集羣,若是B集羣發生了宕機,咱們指望的是來自客戶端的90%的請求正常執行,10%的請求失敗,可是實際上卻可能遠遠超過10%的請求都失敗了,緣由是多方面的:
camellia-redis-proxy在處理上述問題時,採起了以下策略:
部署架構
proxy做爲無狀態的服務,能夠作到水平擴展,爲了服務的高可用,也至少要部署兩個以上的proxy節點,對於客戶端來講,想要像使用單節點redis同樣訪問proxy,能夠在proxy層以前設置一個LVS代理服務,此時,部署架構圖以下:
固然,還有另一個方案,能夠將proxy節點註冊到zk/Eureka/Consul等註冊中心,客戶端經過拉取和監聽proxy的列表,而後再向訪問單節點redis同樣訪問每一個proxy便可。以Jedis爲例,僅需將JedisPool替換爲封裝了註冊發現邏輯的RedisProxyJedisPool,便可像訪問普通redis同樣使用proxy了,此時,部署架構圖以下:
應用場景
結 語
Redis cluster做爲官方推薦的集羣方案,愈來愈多的項目已經或正在遷移到redis cluster,camellia-redis-proxy正是在這樣的背景下誕生的;特別的,若是你是一個Java開發者,camellia還提供了CamelliaRedisTemplate這樣的方案,CamelliaRedisTemplate擁有和普通Jedis一致的API,提供了mget/mset/pipeline等原生JedisCluster不支持的特性,且提供了和camellia-redis-proxy功能一致的分片/雙寫等特性。
爲了回饋社區,camellia已經正式開源了,想詳細瞭解camellia項目的請點擊【閱讀原文】訪問github,同時附上地址:
https://github.com/netease-im...
若是你有什麼好的想法或者提案,或者有什麼問題,歡迎提交issue與咱們交流!
關於做者
曹佳俊。網易智慧企業資深服務端開發工程師。中科院研究生畢業後加入網易,一直在網易雲信負責IM服務器相關的開發工做。
做者:網易雲信 連接:https://segmentfault.com/a/1190000023210717 來源:SegmentFault 思否 著做權歸做者全部。商業轉載請聯繫做者得到受權,非商業轉載請註明出處。