貝殼:流式數據的平臺化實踐與挑戰

今天爲大家分享貝殼找房流式數據的平臺化實踐與挑戰,具體介紹下如何建設流式數據平臺來滿足業務方的需求。 ▌總體架構 貝殼找房大數據的整體架構,從下到上分爲四層: 1. 基礎平臺層。這一層應用的都是比較常見的技術:HDFS 分佈式存儲,yarn 分佈式調度,以及 HBase 存儲,另外還有一些計算引擎,如 hive、tez、spark、presto、kylin、clickhouse、SparkML 等
相關文章
相關標籤/搜索