Hive,SQL,MapReduce,Hadoop,Spark等這些關係及理解

    由於數據量巨大,單機無法存儲,所以我們需要將用很多臺機器存儲數據,HDFS(Hadoop Distributed FileSystem)就應用而生,它是專門負責管理這麼多臺單機之間的數據,你存取數據都是和單機一樣的操作流程,但實際上這些數據都是在多臺單機上存儲的,相當於HDFS是一個幫你管理大數據的界面,你不用管它後面是怎麼的關係,只需要在它這兒操作就可以了。光有數據也不行啊,數據我們是要
相關文章
相關標籤/搜索