什麼是GREENPLUM?數據庫
對於不少IT人來講GREENPLUM是個陌生的名字。簡單的說它就是一個與ORACLE, DB2同樣面向對象的關係型數據庫。咱們經過標準的SQL能夠對GP中的數據進行訪問存取。
GREENPLUM與其它普通的關係型數據庫的區別?
服務器
本質上講GREENPLUM是一個關係型數據庫集羣. 它其實是由數個獨立的數據庫服務組合成的邏輯數據庫。與RAC不一樣,這種數據庫集羣採起的是MPP架構。以下圖所示網絡
它 的組件分紅三個部分MASTER/SEGMENT以及MASTER與SEGMENT之間的高效互聯技術GNET。其中MASTER和SEGMENT自己就 是獨立的數據庫SERVER。不一樣之處在於,MASTER只負責應用的鏈接,生成並拆分執行計劃,把執行計劃分配給SEGMENT節點,以及返回最終結果 給應用,它只存儲一些數據庫的元數據,不負責運算,所以不會成爲系統性能的瓶頸。這也是GREENPLUM與傳統MPP架構數據庫的一個重要區別。 SEGMENT節點存儲用戶的業務數據,並根據獲得執行計劃,負責處理業務數據。也就是用戶關係表的數據會打散分佈到每一個SEGMENGT節點。當進行數 據訪問時,首先全部SEGMENT並行處理與本身有關的數據,若是須要segment能夠經過進行innterconnect進行彼此的數據交互。 segment節點越多,數據就會打的越散,處理速度就越快。所以與SHARE ALL數據庫集羣不一樣,經過增長SEGMENT節點服務器的數量,GREENPLUM的性能會成線性增加。
GREENPLUM適用場景?
GREENPLUM雖然是關係型數據庫產品,它的特色主要就是查詢速度快,數據裝載速度快,批量DML處理快。並且性能能夠隨着硬件的添加,呈線性增長,擁有很是良好的可擴展性。所以,它主要適用於面向分析的應用。好比構建企業級ODS/EDW,或者數據集市等等。
GREENPLUM運行的平臺?
GREENPLUM運行在X86架構的硬件平臺上,目前支持的操做系統包括32/64位的 LINUX(REDHAT/SUSE)/SOLARIS/MAC OS
GREENPLUM的前景?
GREENPLUM 誕生於2003年硅谷,2010/07 EMC收購了GREENPLUM,並把GREENPLUM做爲EMC面向分析雲的戰略核心產品,加以大力發展。該產品不只在國際市場發展很快,在國內市場 發展也很快。最著名的案例就是阿里巴巴集團,通過多種產品的精心選型,最終選擇GREENPLUM做爲它們的數據倉庫平臺存放數百TB的業務數據去高效支 持各類分析應用。
如何學習GREENPLUM?
正是因爲產品發展速度很快,可是在相關人才上存在很大缺口。所以,我我的認爲對於各位有興趣的技術人員來講,是一個很好的職業發展機會。以我的經驗來講, 只要有其它關係型數據庫的基礎,尤爲是POSTGRESQL或者INFORMIX基礎的(由於GREENPLUM是在POSTGRESQL基礎上開發出來 的),很容就能夠上手學習並掌握GREENPLUM。
GREENPLUM的手冊寫的很是好,徹底能夠做爲入門的教材使用。其軟件自己也是軟性LICENSE,用於學習研究徹底免費,並且與生產環境並沒有不一樣,這與ORACLE徹底同樣。
如何下載GREENPLUM的資料?
官方途徑能夠從網站 HTTP://gpn.greenplum.com上下載手冊和軟件。但國內因爲網絡問題,可能不太好用。但願論壇或者哪位同志能提供一個好用的網盤,我願意與你們分享相關軟件和資料架構