基於大數據技術構建數倉模型實踐

        最近剛接觸一個線上運行的數倉環境,是針對用戶流量日誌做點擊量指標的多維度分析,維度表每天一個快照,經過數據統計分析發現有的維度表數據量很大,每天竟然有5億多條的素材日誌,並且這些維度數據是漸變維度,數據存儲在亞馬遜S3文件系統上面,嚴重浪費公司的存儲成本,同時要是查詢跨度一個周的數據則涉及到的維度數據就40億條進行關聯,這還不算其他維度的統計在內,個人觀點,涉及到這些大維度數據的統
相關文章
相關標籤/搜索