Big SQL Federation是什麼?
Big SQL Federation 是一種Hadoop與遠程數據源的集成技術。經過Federation技術,管理員或應用程序可以使用標準SQL透明地查詢Big SQL (Hadoop) 和RDBMS 上的表。架構
爲何要用Federation?
在某些場景下,Hadoop平臺上的數據分析須要用到RMDBS上的數據,每次從數據源移動或複製數據到Hadoop是不現實的,由於您要考慮移動或複製數據的頻率、時間成本、管理成本等等。這樣,利用Federation技術直接、透明地訪問遠程RMDBS數據源成爲解決問題的有效途徑。app
Big SQL Federation的架構和組件
- Federation Server:Big SQL內置功能,使用時只須要簡單地「開啓」這個功能。Federation Server運行在Big SQL的Head Node,它在Federation Catalog中記錄額外的元數據,如Wrapper、Nickname等。
- Wrapper:訪問/查詢遠程數據源對應的lib文件,如Oracle,DB2,或Teradata等RMDBS的數據驅動程序lib文件。BigSQL利用這個lib與遠程數據源進行交互。
- Server:即遠程的數據源在Big SQL的表現。一個數據源對應一個Server。
- Nickname:遠程數據源上的表或視圖在本地的別名,對應Big SQL的用戶,Nickname與本地Table看起來是同樣的。
Federation有何功能?
- 訪問HDFS、HBase、Hive等Big SQL表或視圖。
- 訪問Oracle、Teradata、MSSQL Server、 DB二、Informix、Netezza的RDBMS表或視圖。
- 跨任意數據源查詢數據(project、restrict、join、union、子查詢、內置函數)
- 調用數據源的特定SQL
- 收集統計信息和檢查詳細執行計劃
如何使用Federation?
1. 管理員開啓Big SQL的Federation功能函數
2. 配置Wrapper和Server,將遠程數據源在本地創建通訊oop
3. 建立Nickname,映射遠程數據源的表大數據
4. 應用鏈接至Big SQL優化
5. 如同訪問本地Table同樣地訪問Nicknamespa
6. Big SQL後臺的優化器建立全局的執行計劃rest
7. 查詢任務被push down到本地和(或)遠程的的數據源執行。orm
更多大數據與分析相關行業資訊、解決方案、案例、教程等請點擊查看>>>教程