1. 分身大法--pureScale算法
在介紹pureScale以前,不得不先談一下IBM DB2 for z/OS,由於DB2 pureScale 的思路和架構幾乎所有來自於DB2 for z/OS。當今沒有一款數據庫產品可以在擴展性和高可用性方面與DB2 for z/OS相提並論,緣由是DB2 for z/OS 採用額底層技術能夠確保服務器持續知足SLA(Service-Level Agreement的縮寫,意思是服務等級協議)的要求,其Coupling Facility 技術提供了幾種的鎖處理和全局緩存機制,這爲服務器擴展和高速恢復提供了可能。所以DB2 pureScale 徹底繼承了DB2 for z/OS 的優良傳統,使用軟件實現了類 z/OS的功能,同時這些軟件藉助於直接內存讀寫(RDMA)技術,繞過CPU中斷處理,徹底能夠替換 z/OS硬件底層實現,實現大吞吐量和高響應的時間。sql
pureScale是DB2 的一種架構方式,同時這種架構方式歸類爲IBM對share Disk的一種具體實現。其中有三個特色。數據庫
a. 無限的擴展能力:DB2 pureScale 最多支持128個節點,同時增長節點對性能提高計劃是線性關係。在沒有硬件瓶頸的狀況下,性能損失是很是少的。緩存
b. 應用透明:應用無須改動便可支持pureScale架構,同時擴展節點對應用無影響。安全
c. 持續的高可用性:單個節點失效對總體的應用幾乎無影響,而且能夠進行快速恢復。服務器
說明: 上面使用了 4 個 AIX 6.1 LPAR — 2 個成員和 2 個 CF — 來講明全部的基本驗證步驟。多線程
pureScale 的安裝與管理請參考: 架構
http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1011db2purescalefeature/併發
http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-1005purescalefeature/運維
2. 九陰白骨爪--continue Data Ingest
Ingest 是DB2 V10.1 的新特性,爲了經過大量持續的數據流來實時和併發的快速進行數據導入而引入的新概念。這樣避免數據被鎖,能夠24小時對數據庫進行操做。Ingest有數據修復的功能,在數據導入中斷時能找到中斷點並能繼續進行數據導入。Ingest 支持複雜的sql表達式語法,是更加的好用的客戶端軟件。用戶能夠用Ingest作Insert ,Update,Delete ,Replace和Merge操做,更方便爲客戶提供服務。
Ingest支持文件和管道兩種輸入類型,支持DEL、ASC兩種數據格式,支持SQL表達式,支持Insert、Update、Replace、Delete和Merge操做,支持併發更改、插入,刪除,能夠根據時間間隔或數據條數來提交數據。Ingest會把未插入的數據放入文件、表中、或者直接丟棄,支持修復和重啓。
Ingest支持ESC、PureScale和DPF環境。Ingest與數據引擎使用標準化的外部鏈接,是個多線程的工具,速度快,效率高。
(1)傳輸:傳輸程序從數據源中讀取,並將記錄放置在格式化程序隊列中。對於INSERT操做,每一個輸入源都有一個傳輸程序線程(例如,每一個輸入文件都有一個線程)。對於UPDATE和Delete操做,只有一個傳輸程序線程。
(2)格式化:格式化程序會解析每條記錄,將數據轉化成DB2數據庫系統所須要的格式並將每條已格式化的記錄放置在該記錄分區上的其中某個清空程序隊列中。
(3)清空:清空程序發出SQL語句以對DB2表執行操做。
INGEST 與Load、Import 在功能上的差別:
1. Ingest只支持del和asc數據格式,而Import還能夠支持WSD和ixf格式,load還能夠支持Ixf和cursor格式。
2.Ingest用於支持ASC數據格式的參數與Load、import不一樣,Import、load使用method L()來統一設置全部字段的位置,而Ingest分別使用Position(:)來處理每一個字段。
3.Ingest支持把錯誤數據放入文件或表中,Load支持把錯誤數據放入文件中,Import不支持把錯誤數據放到數據表文件中。
DB2 10.1 版本還增長了不少特性,例如:自適應壓縮,超級異步,重作延遲,多備機,runstats支持索引採樣,優化查詢性能,加強監控、安全性能等。這裏就不一一介紹了,但願你們能夠到IBM developerWorks 中國上檢索。最後介紹一下自適應壓縮的設計實現。
自適應實際使用兩種壓縮算法。
第一種方法使用表級別壓縮字典,根據表中數據抽樣的重複狀況來成天壓縮數據,第一次建立表級別壓縮字典時,系統使用啓用經典壓縮後添加至表中的大約第一個兆字節數據中的數據樣本構建該字典。除非顯式致使字典重建,不然系統不會再次更新該字典。即便重建該字典,該字典也只反映整個表中數據的樣本。也就是說,表級別字典是靜態字典,表級別壓縮字典存儲在應用該字典的對象的隱藏行中,而且會高速緩存在內存中以便快速訪問。
第二種方法使用基於頁級別字典的壓縮算法以根據每一個數據頁中的數據重複狀況來壓縮數據,這些字典將重複字節模式映射至小得多的符號,而後這些符號會替換表中的較長字節模式。表級別壓縮字典存儲在爲其建立該字典的表對象中,用於壓縮整改表的數據。頁級壓縮字典與數據頁中的數據存儲在一塊兒,僅用於壓縮該頁中的數據,須要的空間也極少。
聲明:本文主要內容摘抄牛新莊《按部就班DB2(第2版)--DBA系統管理、運維與應用案例》