大數據之Hadoop教程

Hadoop是一個開源框架,它允許在整個集羣使用簡單編程模型計算機的分佈式環境存儲並處理大數據。它的目的是從單一的服務器到上千臺機器的擴展,每一個臺機都可以提供本地計算和存儲。 「90%的世界數據在過去的幾年中產生」。 由於新技術,設備和類似的社交網站通信裝置的出現,人類產生的數據量每年都在迅速增長。美國從一開始的時候到2003年產生的數據量爲5十億千兆字節。如果以堆放的數據磁盤的形式,它可以填補
相關文章
相關標籤/搜索