想從事大數據、海量數據處理相關的工作,如何自學打基礎?

海量數據分成兩塊,一是系統建設技術,二,海量數據應用。先說系統建設,現在主流的技術是HADOOP,主要基於mapreduce的分佈式框架。目前可以先學習這個。 但是我的觀點,在分佈式系統出來之前,主要是集中式架構,如DB2,oracle。爲什麼現在用分佈式架構,那是因爲現在集中式架構受限於IO性能,出來速度慢,如果又一種硬件技術,可以很快地處理海量數據,性能上能滿足需求,那麼集中式架構優於分佈式架
相關文章
相關標籤/搜索