Hive-1-基礎

Hadoop 簡介 Hadoop是一個開源框架來存儲和處理大型數據在分佈式環境中。包含兩個模塊,一個是MapReduce,另一個是Hadoop分佈式文件系統(HDFS)。 MapReduce:是一種並行編程模型,在大型集羣普通硬件可用於處理大型結構化,半結構化和非結構化數據。 HDFS:Hadoop分佈式文件系統是Hadoop框架的一部分,用於存儲和處理數據集。提供了一個容錯文件系統在普通硬件上運
相關文章
相關標籤/搜索