DataLake with Hadoop Ecosystem

時間 2021-01-08

標籤 DataLake Hadoop 欄目 Hadoop 简体版

原文原文鏈接

Hadoop是實現數據湖最常用的技術手段，目前是最理想的選擇，Hadoop生態系統提供批處理、實時處理引擎，還提供海量數據存儲能力，數據處理架構如下圖：目前常見的兩種使用方式： 1）第一種方式是將Hadoop作爲ETL工具，並且數據備份或者冷數據存儲其PB級別數據，在Hadoop中數據冗餘而且較容易恢復，如下圖所示： MapReduce及Spark Engine可以用來處理非結構化數據，

>>阅读原文<<

相關文章

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

1. Hadoop ecosystem
2. Hadoop ecosystem 生態圈
3. Data ETL tools for hadoop ecosystem Morphlines
4. Create a "collaborative ecosystem" with blockchain
5. DataLake in Azure
6. DataLake in Hortonworks
7. Big Data Ecosystem Dataset
8. DataLake in AWS
9. DataLake 基本概念
10. Kafka Ecosystem（Kafka生態）

>>更多相關文章<<