基於大數據技術構建數倉模型實踐

        最近剛接觸一個線上運行的數倉環境,是針對用戶流量日誌作點擊量指標的多維度分析,維度表天天一個快照,通過數據統計分析發現有的維度表數據量很大,天天居然有5億多條的素材日誌,而且這些維度數據是漸變維度,數據存儲在亞馬遜S3文件系統上面,嚴重浪費公司的存儲成本,同時要是查詢跨度一個周的數據則涉及到的維度數據就40億條進行關聯,這還不算其餘維度的統計在內,我的觀點,涉及到這些大維度數據的統
相關文章
相關標籤/搜索