用於假人的HDFS

每當新手想要開始學習Hadoop時,Hadoop堆棧中的元素數量就令人難以置信,有時甚至難以理解。 我試圖解密整個堆棧,並以自己的方式幫助解釋基本內容。 在開始討論Hadoop堆棧之前,讓我們退後一步,嘗試瞭解導致Hadoop起源的原因。 問題 –隨着互聯網的普及,存儲的數據量不斷增長。 讓我們以一個搜索引擎(例如Google)爲例,該引擎需要索引正在生成的大量數據。 搜索引擎對數據進行爬網並建立
相關文章
相關標籤/搜索