Hive，SQL，MapReduce,Hadoop,Spark等這些關係及理解

時間 2021-01-13

原文原文鏈接

由於數據量巨大，單機無法存儲，所以我們需要將用很多臺機器存儲數據，HDFS(Hadoop Distributed FileSystem)就應用而生，它是專門負責管理這麼多臺單機之間的數據，你存取數據都是和單機一樣的操作流程，但實際上這些數據都是在多臺單機上存儲的，相當於HDFS是一個幫你管理大數據的界面，你不用管它後面是怎麼的關係，只需要在它這兒操作就可以了。光有數據也不行啊，數據我們是要

>>阅读原文<<