hadoop總結及hdfs的讀寫流程

一、hadoop簡介:hadoop是一個適合海量數據存儲和計算的分佈式基礎框架,其起源於google三篇論文。其中,hadoop2.x的版本中,概括起來可分爲三大核心或四大模塊。三大核心是指:hdfs(分佈式文件系統)、yarn(任務調度和資源管理)、mapreduce(分佈式離線計算框架);而四大模塊除了包括上述的三個核心組件外,外加一個hadoop common組件(其爲三大核心組件提供基礎工
相關文章
相關標籤/搜索