大數據學習文章

ZooKeeper:

ZooKeeper淺析:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3113923.htmlhtml

ZooKeeper原理及使用:http://www.wuzesheng.com/?p=2609#more-2609

Zookeeper 快速理解android

HDFS:redis

MapReduce程序的工做過程: http://www.aboutyun.com/thread-15494-1-2.html算法

HDFS小文件處理解決方案總結:http://www.aboutyun.com/thread-14227-1-1.html數據庫

Hadoop 學習總結之一:HDFS簡介:http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html編程

Hadoop集羣做業調度算法

 

 

MapReducesegmentfault

初步掌握Yarn的架構及原理


hadoop雜記-爲何會有Map-reduce v2 (Yarn):http://www.cnblogs.com/LeftNotEasy/archive/2012/02/18/why-yarn.html性能優化

YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework:http://blog.csdn.net/colorant/article/details/9146201架構

從Container內存監控限制到CPU使用率限制方案

 

MapReduce程序的工做過程: http://www.aboutyun.com/thread-15494-1-2.htmlapp

hadoop學習(六)WordCount示例深度學習MapReduce過程(1)

Hadoop核心架構HDFS+MapReduce+Hbase+Hive內部機理詳解:http://blog.csdn.net/yczws1/article/details/19178265

hadoop學習WordCount+Block+Split+Shuffle+Map+Reduce技術詳解:http://blog.csdn.net/yczws1/article/details/21899007

MapReduce調度與執行原理系列文章

1、MapReduce調度與執行原理之做業提交

2、MapReduce調度與執行原理之做業初始化

3、MapReduce調度與執行原理之任務調度

4、MapReduce調度與執行原理之任務調度(續)

JobTracker做業啓動過程分析:http://blog.csdn.net/androidlushangderen/article/details/41356521

Hadoop集羣做業調度算法

淺析 Hadoop 中的數據傾斜:http://my.oschina.net/leejun2005/blog/100922

Hadoop源碼解析之: TextInputFormat如何處理跨split的行:http://blog.csdn.net/bluishglc/article/details/9380087

mapreduce排序和二次排序以及全排序

MapReduce框架中全排序的算法思想--學習筆記

mapreduce編程(一)-二次排序

MapReduce 圖解流程超詳細解答(1)-【map階段】

MapReduce 圖解流程超詳細解答(2)-【map階段】

hive:

hive基本操做:http://www.aboutyun.com/thread-6867-1-1.html

hive組件和執行過程:http://blog.csdn.net/lifuxiangcaohui/article/details/40262021

大數據時代的技術hive介紹:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.html

Hive體系結構:http://blog.csdn.net/lifuxiangcaohui/article/details/40615843

 深刻淺出數據倉庫中SQL性能優化之Hive篇

【hive】hive的查詢注意事項以及優化總結

HIVE Group by、join、distinct等實現原理 

Hive SQL的編譯過程

Hive之分區(Partitions)和桶(Buckets)

Hive性能優化

HBase:
Hadoop核心架構Hbase:http://blog.csdn.net/yczws1/article/details/19178265

HBase學習:http://blog.bcmeng.com/post/hbase-note.html

 

HBase系統入門--總體介紹 

Hbase寫數據,存數據,讀數據的詳細過程

Hbase rowkey設計一 

HBase的rowkey設計(含實例)

LSM樹由來、設計思想以及應用到HBase的索引 

HBase在搜狐內容推薦引擎系統中的應用  

Hbase建模 

Hbase和Oracle的對比

關於HFile的存儲結構梳理以及快速定位rowkey

HBase二級索引方案總結

hbase 學習(十六)系統架構圖

HBase -ROOT-和.META.表結構(region定位原理)

Hbase 學習(九) 華爲二級索引(原理)

HBase高性能複雜條件查詢引擎

【HBase】zookeeper在HBase中的應用

HBase何時做minor major compact

HBase的compact分析

二級索引方案:http://www.aboutyun.com/thread-14201-1-1.html 

hbase分頁應用場景及分頁思路與代碼實現

hbase權威指南閱讀隨手筆記二之過濾器

*HBase原理、設計與優化實踐

HBase性能優化方法總結 

HBase 管理,性能調優

HBase Rowkey的散列與預分區設計

Hbase總結(六)hbase37個筆試題

Solr:

Lucene學習總結之一:全文檢索的基本原理

Solr學習和總結(線下1)

solr學習2

Solr使用

基於Solr的HBase多條件查詢測試

 

Elasticsearch與Solr 選型

ElasticSearch:

ElasticSearch學習1

ES學習2

ElasticSearch使用代碼 

修改ES分片規則 

 

Redis:

NoSQL and Redis

redis集羣配置

15天玩轉redis(mark,redis學習系列) 

幾款主流 NoSql 數據庫的對比(轉)

 redis源碼系列

 

Kafka:

快速理解Kafka分佈式消息隊列框架 

Kafka可靠性的思考

Kafka深度解析

Apche Kafka 的生與死 – failover 機制詳解

Kafka消息的可靠性測試--針對直播業務的方案選擇

Kafka文件存儲機制那些事

高可用保證消息絕對順序消費的BROKER設計方案

Kafka 之 入門 

Kafka 之 中級

flume-kafka-storm日誌處理經驗

【採集層】Kafka 與 Flume 如何選擇

 

使用Java API建立(create),查看(describe),列舉(list),刪除(delete)Kafka主題(Topic)

 

Flume:

Flume1.5.0入門:安裝、部署、及flume的案例

Flume(NG)架構設計要點及配置實踐: http://shiyanjun.cn/archives/915.html

基於Flume的美團日誌收集系統(一)架構和設計

 

 

Storm:

Storm快速理解

從Storm和Spark 學習流式實時分佈式計算的設計

Twitter Storm如何保證消息不丟失

Storm:最火的流式處理框架

使用Storm實現實時大數據分析

Storm ack和fail機制再論

Apache Storm內部原理分析

 

你瞭解實時計算嗎?

 

Spark:

Apache Spark源碼走讀之1 -- Spark論文閱讀筆記

Spark 快速理解

論SparkStreaming的數據可靠性和一致性 

Spark和Hadoop做業之間的區別

科普Spark,Spark核心是什麼,如何使用Spark(1)

從Storm和Spark 學習流式實時分佈式計算的設計 

 Spark Streaming:大規模流式數據處理

Docker:

快速理解Docker - 容器級虛擬化解決方案  

 

Scala

Tachyon

Impala

Oozie

oozie 入門

ganglia

.......

分佈式與集羣的區別

 

大數據(一) - hadoop生態系統及版本演化 
大數據(二) - HDFS 
大數據(三) - YARN 
大數據(四) - MapReduce 
大數據(五) - HBase 
大數據(六) - ZooKeeper 
大數據(七) - Flume 
大數據(八) - Sqoop 
大數據(九) - Hive 
大數據(十) - Pig 
大數據(十一) - Mahout 
大數據(十二) - Oozie 
大數據(十三) - Azkaban 
大數據(十四) - Storm 
大數據(十五) - JStorm 

相關文章
相關標籤/搜索