第1篇:GreenPlum的介紹/架構

1、GreenPlum介紹

GreenPlum是基於數據庫分佈式架構的開源大數據平臺;採用無共享(no shareing)的MPP架構;具備良好的線性擴展能力,具備高效的並行運算、並行存儲特性。擁有獨特的高效的ORCA優化器。兼容SQL語法。適合用於高效PB數據量級的存儲、處理和實時分析能力。因爲內核是基於PostgreSQL數據庫;也支持涵蓋OLTP型業務混合負載。同時數據節點和主節點都有本身備份節點。提供數據庫的高可用性。html

2、GreenPlum架構

 

架構算法

在GreenPlum數據庫中組件;從上圖能夠看出Master節點、Segment節點、interconnect數據庫

  • Master節點:爲主節點;做爲數據庫的入口,負責客服端鏈接;對客服端的請求生成查詢計劃;分發給某個或者全部的Segment節點。
  • standby master: 做爲master節點的備庫;爲其提供高可用性。在Master節點出現故障;經過gpactivestandby命令激活。接管master工做
  • interconnect:是GreenPlum的網絡層;負責每一個節點之間的通訊。
  • segment節點:爲數據節點;接收master分發下來的查詢計劃;執行返回結果給master節點
  • mirror segment節點: 做爲segment節點的備庫;爲了提供高可用性;一般跟對應的segment節點不在同一臺機器上。在segment節點出現故障,mirror segment自動接管進行工做。可是爲了數據庫平穩;儘快恢復出現故障的segment。

對用戶而言能夠把整個GreenPlum數據庫當成PostgreSQL數據庫。網絡

Greenplum數據庫可使用追加優化(append-optimized,AO)的存儲個事來批量裝載和讀取數據,而且能提供HEAP表上的性能優點。 追加優化的存儲爲數據保護、壓縮和行/列方向提供了校驗和。行式或者列式追加優化的表均可以被壓縮。架構

3、Greenplum數據庫和PostgreSQL的主要區別在於:

  • 在基於Postgres查詢規劃器的常規查詢規劃器以外,能夠利用GPORCA進行查詢規劃。
  • Greenplum數據庫可使用追加優化的存儲。
  • Greenplum數據庫能夠選用列式存儲,數據在邏輯上仍是組織成一個表,但其中的行和列在物理上是存儲在一種面向列的格式中,而不是存儲成行。列式存儲只能和追加優化表一塊兒使用。列式存儲是可壓縮的。當用戶只須要返回感興趣的列時,列式存儲能夠提供更好的性能。 全部的壓縮算法均可以用在行式或者列式存儲的表上,可是行程編碼(RLE)壓縮只能用於列式存儲的表。Greenplum數據庫在全部使用列式存儲的追加優化表上都提供了壓縮。

Greenplum如何存儲在下面章節講解。app

參考文獻:https://greenplum.cn/gp6/intro/arch_overview.html分佈式

備註:以上爲本人理解;如有不對的地方;煩請指出。謝謝!性能

相關文章
相關標籤/搜索