大數據的生態圈 Hadoop,hive,spark

大數據自己是個很寬泛的概念,Hadoop生態圈(或者泛生態圈)基本上都是爲了處理超過單機尺度的數據處理而誕生的。各有各的用處,互相之間又有重合。可是每一個工具備本身的特性,雖然奇怪的組合也能工做,可是未必是最佳選擇。程序員 HDFS:算法 傳統的文件系統是單機的,不能橫跨不一樣的機器。HDFS(Hadoop Distributed FileSystem)的設計本質上是爲了大量的數據能橫跨成百上千臺
相關文章
相關標籤/搜索