阿里雲HBase Ganos全新升級,推空間、時空、遙感一體化基礎雲服務

一、HBase Ganos是什麼

Ganos是阿里雲時空PaaS服務的自研核心引擎。Ganos已做爲雲數據庫時空引擎與數據庫平臺融合,創建了以自研雲原生數據庫POALRDB爲基礎,聯合NoSQL大數據平臺(Ali-HBASE和X-Pack Spark)的完整時空地理信息雲化管理解決方案。html

HBase Ganos是爲PB級分佈式、大規模時空數據管理而生,主打NoSQL時空大數據處理能力,兼容HBase、Spark、GeoMesa、GeoServer等普遍開源生態,內置了高效的時空索引算法、空間拓撲幾何算法、遙感影像處理算法等,可普遍應用於空間/時空/遙感大數據存儲、查詢、分析與數據挖掘場景。前端

二、新版本重要特性

全球首發時空柵格引擎雲服務,支撐航天航空遙感雲計算與智能化發展

對地觀測技術的快速發展正促使遙感應用走向在線化和服務化。全新的雲上時空柵格數據引擎面向將來遙感大數據雲端智能分析計算需求而設計,採用了極爲靈活的時空數據組織方式,在保留多時相、多分辨率且每一寸像素光譜信息的同時,兼顧傳統遙感應用的快速瀏覽需求。引擎內置的ETL工具能夠打通OSS、HBase、POLARDB/PG等數據存儲產品,支持柵格數據的全自動化快速入庫,包含投影轉換、數據分塊和索引建立等。柵格數據存儲組織支持多種模式,經常使用的包括全球標準格網剖分和本地座標系格網剖分(見下圖)。算法

此外,2.5版本發佈全新的時空Cover數據模型。Cover模型物理上維護每一幅遙感影像的獨立性,同時支持海量遙感影像基於時相和空間條件的動態拼接,邏輯上實時生成時空動態一張圖,爲遙感智能化分析計算應用提供強大數據模型支撐。數據庫

與X-Pack Spark、 GeoTools集成,提供兼容OGC標準的空間數據訪問接口

2.5版本提供了更全面的訪問方式,包括基於GeoTools API的訪問、支持GeoJson做爲時空數據結構的REST API、以及空間GeoSQL支持,可最大程度兼容不一樣用戶需求。其中,Ganos Spark模塊提供了一系列UDF空間算子實現了基於OGC標準的GeoSQL的空間數據查詢,例如:性能優化

這些空間算子主要包括Geometry Constructors函數、Geometry Accessors函數、Geometry Cast函數、Geometry Editors函數、Geometry Outputs函數、Spatial Relationships函數以及Geometry Processing函數等,算子功能將按需擴展。數據結構

支持時空幾何、時空軌跡數據建模,成本、性能得到綜合優化

2.5版本支持豐富的時空幾何數據、時空軌跡數據建模,數據類型包括點、線、面等時空對象。在此基礎上,還提供了完備的時空模型操做能力,既能夠支持空間範圍查詢,也支持「時間+空間」的多維查詢。 
在性能優化方面,採用了空間謂詞下推技術,查詢時可將空間過濾條件下推到存儲層執行,從而減小I/O開銷,下降查詢時延。另外,結合阿里雲X-Pack可構建強大的時空分析平臺,藉助空間分區、分區索引、基於內存索引以及Fast Spatial Jion等性能優化手段,可大幅提升查詢分析性能。架構

在成本控制方面,針對時空數據寫入膨脹的問題,新版本在索引生成、時空模型編碼、冷熱分離存儲等方面進行了全面優化。在索引生成階段,對索引的控制力度更細,可按需創建索引;在時空編碼方面,使用了TWKB編碼,同時用戶可指定寫入數據的精度,減小數據的存儲長度;在冷熱分離存儲方面,藉助阿里雲OSS存儲,可以使得存儲成本降低70%以上。併發

三、典型應用場景

航天航空遙感應用

對地觀測、商業航天、無人機測繪等快速發展,積累了大量的遙感影像數據。數據規模的不斷擴大給數據時空化組織以及大數據和智能化應用帶來了極大挑戰。將來須要探索數據在線、應用能力在線、用戶購買服務模式。Ganos能夠爲雲平臺商、衛星數據廠商、平臺服務商等構建遙感智能化大數據雲平臺提供時空雲基礎設施支撐,解決最底層關鍵技術,並在傳統編目化管理和切片化應用基礎上得到全新架構的快速演進,從而在遙感智能化浪潮中聚焦業務並得到先機。框架

互聯網出行

互聯網出行涉及到運力的調度、拼車、供需預測、熱力圖等業務。以供需預測爲例,基於對歷史軌跡數據的分析,並結合實時訂單數據,預測當前訂單密集區域的分佈,提升接單機率並減小司機空駛時間。這背後涉及到大量時空型數據和業務信息的快速讀取,並結合業務算法進行預測,利用HBase Ganos可有力支持該業務場景。運維

傳感網與實時GIS

在環保、氣象、水利、航海航空監測等領域,須要經過各類傳感器獲取天、空、地、海不一樣地理現象、事件、要素的全生命週期多尺度監測指標,好比污染監測、水位監測、降雨量監測、航標監測等。HBase Ganos能夠爲構建實時GIS大數據應用提供穩定、可靠、彈性、免運維的PaaS服務,爲地理國情常態化監測和智慧城市建設提供基礎平臺。

車聯網

海量的車輛終端在不斷地產生軌跡數據,軌跡數據包含了時間和空間位置。利用HBase Ganos,實時監測車輛的行駛軌跡、是否偏航、是否進入某個限制區域等。除了實時監控外,還能夠進行時空查詢,如查詢某段時間的軌跡,某段時間進入該區域的車輛等。結合大數據分析框架(如Spark)還能夠進行穿越分析、區域分佈熱力圖等。

智慧物流與外賣遞送

在物流與外賣等領域,須要實時監控車輛、騎手的位置,以便進行可靠的時間預測等服務。車輛和騎手的位置須要實時上報,雲端須要處理高併發寫入並進行實時路徑規劃、偏航監測等計算,背後都須要大量的時空計算。

四、典型案例&架構

航海船舶大數據平臺

場景:全球AIS船舶實時位置數據,天天上億條軌跡寫入,要求軌跡時空/時序查詢秒級響應,具體包括:
• 監管區域實時地理圍欄判斷;
• 軌跡區域回放(指定區域+指定時間段);
• 軌跡回放(指定時間段查詢)。
架構說明:
• AIS等數據通過Spark平臺清洗、融合完成後,構建數倉;
• 對外提供查詢的數據存儲到HBase Ganos中,可供前端各種應用進行時空查詢(如地理圍欄、軌跡回放等);
• 總體系統的查詢時間在毫秒級,數據清洗在分鐘級。

位置服務平臺

場景:實時採集車輛設備軌跡,40萬+終端設備,3萬+軌跡點/秒峯值;對外提供實時位置查詢、地理圍欄、軌跡類似度判斷等服務;
架構說明:
• 利用POLARDB Ganos的MOD移動對象數據庫保存業務、GIS和行程軌跡現勢數據,而HBase Ganos保留全部歷史軌跡庫;
• 當歷史數據量較大時,可經過冷數據自動轉儲功能,將數據存放到OSS中,減小70%以上的成本;
• 百億量級的軌跡查詢(好比查詢某段時間、某空間範圍內通過的軌跡)只需亞秒級;
與X-Pack Spark平臺無縫銜接,能夠提供相似軌跡類似度、OD分析等強大功能。

遙感大數據管理與智能服務平臺

場景:徹底在線化大規模遙感影像數據入庫、查詢、分析和AI智能服務。
痛點:
• 遙感影像數據體量大且增量快,存儲、計算擴展不靈活;
• 以原始文件爲單位管理模式粗放,數據結構不統一,上層調用複雜;
• 傳統靜態切片方式管理顯示速度快,但光譜信息丟失,沒法有效支撐實時分析場景和AI場景;
• 多源空間數據融合查詢分析困難。
架構說明:
• 原始數據採用OSS高性價比存儲,冷熱分離;
• 影像數據庫採用SQL+NoSQL構建時空序列影像,容量無上限,存儲與計算分離,極致彈性;
• 數據徹底結構化存儲和組織,保留原始像元信息,有效支撐各種分析計算場景;
• 與X-Pack Spark集成,ETL與多源空間數據分析處理更便捷,可進一步集成阿里天巡平臺,實現遙感AI能力集成。

產品購買:https://cn.aliyun.com/product/hbase?spm=5176.12825654.eofdhaal5.58.7b652c4acM9Dyn

產品使用手冊:https://help.aliyun.com/document_detail/87287.html?spm=a2c4g.11174283.6.684.562f3c2eu7WQdR

 

本文做者:Roin

原文連接

本文爲雲棲社區原創內容,未經容許不得轉載。

相關文章
相關標籤/搜索