Hadoop 原理和架構

04 | 移動計算比移動數據更划算 那麼如何解決 PB 級數據進行計算的問題呢? 這個問題的解決思路其實跟大型網站的分佈式架構思路是一樣的,採用分佈式集羣的解決方案,用數千臺甚至上萬臺計算機構建一個大數據計算處理集羣,利用更多的網絡帶寬、內存空間、磁盤容量、CPU 核心數去進行計算處理。 既然數據是龐大的,而程序要比數據小得多,將數據輸入給程序是不划算的,那麼就反其道而行之,將程序分發到數據所在的
相關文章
相關標籤/搜索