Cassandra架構、設計（集羣&表）和性能報告

時間 2019-11-25

標籤 cassandra 架構設計集羣性能報告欄目系統架構简体版

原文原文鏈接

系統架構：

Ｃａｓｓａｎｄｒａ是一套開源分布式Ｎｏ－ＳＱＬ數據庫系統，基於一致性哈希算法的Ｐ２Ｐ環形結構。這種結構各節點功能徹底相同，可靈活添加節點來完成系統的擴充或刪除節點，且無需大規模轉移數據，同時完全避免系統因單點故障算法

致使的不穩定性；每一個節點經過Ｇｏｓｓｉｐ機制進行消息同步；每個數據項都會被復制到Ｎ個節點（Ｎ是經過參數配置的副本因子），系統利用數據數據庫

的複製機將存儲在各節點上的數據複製到其餘節點上，實現了數據的高度可得到性與安全性。安全

數據模型：

Ｃａｓｓａｎｄｒａ使用寬列存儲模型，每行數據記錄是以Ｋｅｙ－Ｖａｌｕｅ形式進行存儲，其中Ｋｅｙ爲惟一標識。每個Ｋｅｙ－Ｖａｌｕｅ其中的Ｖａｌｕｅ也稱爲Ｃｏｌｕｍｎ，做爲一個三元組，包含有服務器

ＣｏｌｕｍｎＮａｍｅ、Ｃｏｌｕｍｎ　Ｖａｌｕｅ與ｔｉｍｅｓｔａｍｐ；每個ＣＦ由一個Ｋｅｙ及其對應的若干個Ｃｏｌｕｍｎ標識組成。一個網絡

ｋｅｙｓｐａｃｅ包含若干個ＣＦ，相似關係型數據庫中一個架構

ｄａｔａｂａｓｅ可有多個ｔａｂｌｅ。併發

下圖爲一個Ｃｏｌｕｍｎ型數據模型。運維

CPA理論：

ＮｏＳＱＬ典型遵循由Ｅｒｉｃ　Ｂｒｅｗｅｒ提出的ＣＡＰ理論，依據此理論，在一個大規模的分佈式數據系統中，有三個需求是彼此循環依賴的，一致性（ｃｏｎｓｉｓｔｅｎｃｙ）、可用性（ａｖａｉｌａｂｉｌｉｔｙ）、分區耐受性（ｐａｒｔｉｔｉｏｎ　ｔｏｌｅｒａｎｃｅ）。分佈式

一致性：對全部數據庫客戶端使用同樣查詢都可得到相同的數據；性能

可用性：所有數據庫客戶端都可讀寫數據；

分區耐受性：數據庫分散到多個服務器上，即便發生網絡故障，仍可提供服務。

ＣＡＰ理論可簡單描述爲：

一個分布式系統不能同時滿足以上三個特性，最多只能同時滿足兩個。

Ｃａｓｓａｎｄｒａ主要支持可用性和分區耐受性。

在Ｃａｓｓａｎｄｒａ中，數據具備最終一致性，集羣整體的完全

可用性。

存儲機制

Ｃａｓｓａｎｄｒａ依賴本地的文件系統經過內存與磁盤的雙重存儲機制來保證數據的持久性。

Ｃａｓｓａｎｄｒａ有三個重要的數據結構，記錄於內存

的Ｍｅｍｔａｂｌｅ，保存在磁盤中的Ｃｏｍｍｉｔ　Ｌｏｇ和

ＳＳＴａｂｌｅ。

Ｍｅｍｔａｂｌｅ記錄最近的修改，而ＳＳＴａｂｌｅ記錄着數據庫所承載的絕大部分數據。一般情況下，一個Ｃａｓｓａｎｄｒａ表會對應着一個

Ｍｅｍｔａｂｌｅ和多個ＳＳＴａｂｌｅ。

Ｃａｓｓａｎｄｒａ接收到客戶端發送來的數據，首先將寫操做記錄到位於磁

盤的ＣｏｍｍｉｔＬｏｇ中；上述操做成功後，更新位於內存中的Ｍｅｍｔａｂｌｅ數據結構。持續的寫入數據，使得Ｍｅｍｔａｂｌｅ逐漸增加，當其數據量到達某個閾值時，Ｃａｓｓａｎｄｒａ的數據遷移被觸發，一方面將

Ｍｅｍｔａｂｌｅ刷寫到本地磁盤上成爲永久的ＳＳＴａｂｌｅ，另外一方面將ＣｏｍｍｉｔＬｏｇ中的寫入記錄移除。對於讀操做，客戶端先查詢

Ｍｅｍｔａｂｌｅ中的數據，若沒法獲取所需信息，則檢索本地磁盤。

Ｃａｓｓａｎｄｒａ會按期執行壓緊ｃｏｍｐａｃｔ操做，將同一條數據不一樣的版本進行合併，過期數據也會在此過程當中被刪除；分層數據壓縮，有效減小數據體積

及磁盤Ｉ／Ｏ。

系統設置（集羣）

針對實時氣象數據存儲系統，用戶對該系統讀取的性能需求遠遠高於寫入數據。經過對副本數進行合理設置，可分散讀取壓力。對於５節點集羣，將副本數設置爲３；

Ｒｏｗ分區模式：

採用自動分區方式，使不一樣的Ｒｏｗ　Ｋｅｙ均勻分佈在各節點上，有利於數據讀取壓力的分散。

Ｃａｓｓａｎｄｒａ表設計

做爲典型的非結構化數據，氣象數據能夠由多維索引來肯定一個惟一的數據。

業務用戶常見的操做包括「最新數據」「左右翻頁」「上下翻頁」等。

數據表

根據不一樣數據類型創建相應數據表，用於存儲數據內容，包括：

ＥＣＭＷＦＨＲ（高分辨率數值預報產品）、

ＳＡＴＥＬＬＩＴＥ（衛星資料）、

ＵＰＰＥＲＡＩＲ（高空站點資料）、

ＳＩＮＧＬＥＲＡＤＡＲ（雷達資料）等。

以「Ｔ６３９」爲例說明數據表結構（表１）。

建表語句：ＣＲＥＡＴＥ　ＴＡＢＬＥ "Ｔ６３９ "

（ "ｄａｔａＰａｔｈ " ｔｅｘｔ，ｃｏｌｕｍｎ１ｔｅｘｔ，

ｖａｌｕｅ　ｂｌｏｂ，ＰＲＩＭＡＲＹ　ＫＥＹ（" ｄａｔａＰａｔｈ " ，

ｃｏｌｕｍｎ１））；

層次表

用於存儲全部模式或實況的層次信息，表名爲ｌｅｖｅｌ；用戶在客戶端進行上下翻頁操做，從ｌｅｖｅｌ表中獲取當前層次的上一層或下一層信息；利用層次表與數據表，可檢索到不一樣層次的數據（表２）。

建表語句：ＣＲＥＡＴＥ　ＴＡＢＬＥ　ｌｅｖｅｌ（

"ｄａｔａＰａｔｈ " ｔｅｘｔ，ｃｏｌｕｍｎ１ｉｎｔ，ｖａｌｕｅ　ｉｎｔ，ＰＲＩＭＡＲＹＫＥＹ（" ｄａｔａＰａｔｈ " ，ｃｏｌｕｍｎ１））；

最新時刻表

用於存儲各種數據的最新時刻信息，表名爲ｌａｔｅｓｔｄａｔａｔｉｍｅ。利用最新時刻表，用戶能經過客戶端快速查找到最新數據文件名。用戶根據完整索引（文件路徑與最新數據文件名），例：Ｔ６３９／ＷＩＮＤ／５００／１７０３０１０８．０００，便可在「數據表」中獲取到對應數據（表３）。

建表語句：ＣＲＥＡＴＥ　ＴＡＢＬＥ　ｌａｔｅｓｔｄａｔａｔｉｍｅ

（ " ｄａｔａＰａｔｈ " ｔｅｘｔ，ｃｏｌｕｍｎ１ｔｅｘｔ，ｖａｌｕｅ　ｔｅｘｔ，ＰＲＩＭＡＲＹ　ＫＥＹ（" ｄａｔａＰａｔｈ " ，ｃｏｌｕｍｎ１））；

存儲系統性能測試

測試環境

選用５臺相同配置的服務器用來搭建分佈式存儲系統。服務器操做系統爲Ｒｅｄ　Ｈａｔ　Ｅｎｔｅｒ－ｐｒｉｓｅ　Ｌｉｎｕｘ　Ｓｅｒｖｅｒ　ｒｅｌｅａｓｅ　７．１，處理器參數爲Ｉｎｔｅｌ（Ｒ）Ｘｅｏｎ（Ｒ）ＣＰＵ　Ｅ５－２６２０ｖ２＠２．１０ＧＨｚ，主頻爲２．１ＧＨｚ；內存大小爲２５６ＧＢ；６塊４ＴＢ　ＳＡＴＡ硬盤；服務器間經過萬兆光纖鏈接。Ｃａｓｓａｎｄｒａ數據庫版本爲２．２．５。