知乎的數據同步建設、工具選型及平臺化實踐

在大數據系統中,我們往往無法直接對在線系統中的數據直接進行檢索和計算。 在線系統所使用關係型數據庫、緩存數據庫存儲數據的方式都非常不同,很多存儲系統並不適合分析型(OLAP)的查詢,也不允許分析查詢影響到在線業務的穩定性。 從數倉建設的角度思考,數據倉庫需要依賴於穩定和規範的數據源,數據需要經過採集加工後才能真正被數倉所使用。推動數據同步服務的平臺化,纔有可能從源頭規範數據的產出。數據同步服務不像
相關文章
相關標籤/搜索