Hadoop是Apache軟件基金會旗下的一個開源分佈式計算平臺,爲用戶提供了系統底層細節透明的分佈式基礎架構html
Hadoop是基於java語言開發,具備很好的跨平臺的特性,而且能夠部署在廉價的計算機集羣中java
Hadoop的核心是分佈式文件系統HDFS(Hadoop Distribute File System)和MapReduce,安裝完Hadoop默認就已經安裝了HDFS和Mapreducelinux
Hadoop被公認爲行業大數據標準開源軟件,在分佈式環境下提供了海量數據的處理能力apache
幾乎全部主流廠商都圍繞Hadoop提供開發工具,開源軟件、商業化工具和技術服務,如谷歌、雅虎、微軟、思科、淘寶等都支持Hadoop編程
官方網址:http://hadoop.apache.org/架構
Hadoop是一個可以對大量數據進行分佈式處理的軟件框架,而且是以一種可靠、高效、可伸縮的方式進行處理的,它具備如下幾個方面的特性:框架
高可靠性編程語言
高效性分佈式
高擴展性工具
高容錯性
低成本
運行在linux平臺上
支持多種編程語言
互聯網居多,雅虎、facebook(用於平臺處理、推薦系統和數據倉庫等)、百度、淘寶、網易、華爲、中國移動等,其中,淘寶的Hadoop集羣比較大
1)版本演變
2)圖示
3)各種版本
Apache Hadoop
Hortonworks
Cloudera(CDH:Cloudera Distribution Hadoop)
MapR
在不斷豐富發展,現已成爲一個豐富的Hadoop生態系統
安裝部署請見:Hadoop2-認識Hadoop大數據處理架構-單機部署
HDFS原理:Hadoop4-HDFS分佈式文件系統原理
參考:http://dblab.xmu.edu.cn/post/1089/
參考:https://cwiki.apache.org/confluence/display/HADOOP/Hadoop+Active+Release+Lines