隨着大數據的盛行,Hadoop也流行起來。面過一些公司,包括開發Hadoop :如Cloudera, Hortonworks, MapR, Teradata, Greenplum, Amazon EMR, 使用Hadoop的除了Google,數不勝數了.html
Hadoop 2.0轉型基本無可阻擋,今年下半年要正式發佈了,它的出現讓你們知識體系都 要更新了。Hadoop1.0搞了8年才發佈,2.0不到2年就出來了。2.0的核心是YARN,它的 誕生仍是有趣的故事git
「Hadoop: The Definitive Guide」: 裏面內容很是好,既有高屋建瓴,又有微觀把握,基本適用於1.X版本。好比mapreduce各個子階段,Join在裏面也有代碼實現,第三版算法
Google的三輛馬車,GFS, MapReduce, BigTable Google的新三輛馬車:Caffeine、Pregel、Dremelsql
SIGMOD, VLDB Top DB conferenceapache
Hadoop 2.0新知識; HDFS2 HA,Snapshot, ResourceManager,ApplicationsManager, NodeManager性能優化
HDFS,Replica如何定位app
HDFS Designide
Hadoop 參數調優,性能優化,Cluster level: JVM, Map/Reduce Slots, Job level: Reducer #, Memory, use Combiner? use Compression?
Hadoop Summit 2010 Tuning Hadoop To Deliver Performance To Your Application
關注Cloudera, Hortonworks, MapR
相關係統數據流系統: Storm
內存計算系統: Spark and Shark
交互式實時系統:Cloudera Impala, Apache Drill (Dremel開源實現),Tez (Hortonworks)