大數據學習文章

時間 2019-11-19

標籤數據學習文章简体版

原文原文鏈接

ZooKeeper:

ZooKeeper淺析：http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3113923.htmlhtml

ZooKeeper原理及使用：http://www.wuzesheng.com/?p=2609#more-2609

Zookeeper 快速理解android

HDFS:redis

MapReduce程序的工做過程： http://www.aboutyun.com/thread-15494-1-2.html算法

HDFS小文件處理解決方案總結：http://www.aboutyun.com/thread-14227-1-1.html數據庫

Hadoop 學習總結之一：HDFS簡介：http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html編程

Hadoop集羣做業調度算法

MapReducesegmentfault

初步掌握Yarn的架構及原理

hadoop雜記-爲何會有Map-reduce v2 (Yarn)：http://www.cnblogs.com/LeftNotEasy/archive/2012/02/18/why-yarn.html性能優化

YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework：http://blog.csdn.net/colorant/article/details/9146201架構

從Container內存監控限制到CPU使用率限制方案

MapReduce程序的工做過程： http://www.aboutyun.com/thread-15494-1-2.htmlapp

hadoop學習（六）WordCount示例深度學習MapReduce過程（1）

Hadoop核心架構HDFS+MapReduce+Hbase+Hive內部機理詳解：http://blog.csdn.net/yczws1/article/details/19178265。

hadoop學習WordCount+Block+Split+Shuffle+Map+Reduce技術詳解:http://blog.csdn.net/yczws1/article/details/21899007

MapReduce調度與執行原理系列文章

1、MapReduce調度與執行原理之做業提交

2、MapReduce調度與執行原理之做業初始化

3、MapReduce調度與執行原理之任務調度

4、MapReduce調度與執行原理之任務調度（續）

JobTracker做業啓動過程分析:http://blog.csdn.net/androidlushangderen/article/details/41356521

Hadoop集羣做業調度算法

淺析 Hadoop 中的數據傾斜：http://my.oschina.net/leejun2005/blog/100922

Hadoop源碼解析之: TextInputFormat如何處理跨split的行:http://blog.csdn.net/bluishglc/article/details/9380087

mapreduce排序和二次排序以及全排序

MapReduce框架中全排序的算法思想--學習筆記

mapreduce編程（一）－二次排序

MapReduce 圖解流程超詳細解答(1)-【map階段】

MapReduce 圖解流程超詳細解答(2)-【map階段】

hive:

hive基本操做:http://www.aboutyun.com/thread-6867-1-1.html

hive組件和執行過程:http://blog.csdn.net/lifuxiangcaohui/article/details/40262021

大數據時代的技術hive介紹：http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.html

Hive體系結構：http://blog.csdn.net/lifuxiangcaohui/article/details/40615843

深刻淺出數據倉庫中SQL性能優化之Hive篇

【hive】hive的查詢注意事項以及優化總結

HIVE Group by、join、distinct等實現原理

Hive SQL的編譯過程

Hive之分區（Partitions）和桶（Buckets）

Hive性能優化

HBase：
Hadoop核心架構Hbase：http://blog.csdn.net/yczws1/article/details/19178265

HBase學習：http://blog.bcmeng.com/post/hbase-note.html

HBase系統入門--總體介紹

Hbase寫數據，存數據，讀數據的詳細過程

Hbase rowkey設計一

HBase的rowkey設計（含實例）

LSM樹由來、設計思想以及應用到HBase的索引

HBase在搜狐內容推薦引擎系統中的應用

Hbase建模

Hbase和Oracle的對比

關於HFile的存儲結構梳理以及快速定位rowkey

HBase二級索引方案總結

hbase 學習（十六）系統架構圖

HBase -ROOT-和.META.表結構(region定位原理)

Hbase 學習（九）華爲二級索引（原理）

HBase高性能複雜條件查詢引擎

【HBase】zookeeper在HBase中的應用

HBase何時做minor major compact

HBase的compact分析

二級索引方案：http://www.aboutyun.com/thread-14201-1-1.html

hbase分頁應用場景及分頁思路與代碼實現

hbase權威指南閱讀隨手筆記二之過濾器

*HBase原理、設計與優化實踐

HBase性能優化方法總結

HBase 管理，性能調優

HBase Rowkey的散列與預分區設計

Hbase總結（六）hbase37個筆試題

Solr:

Lucene學習總結之一：全文檢索的基本原理

Elasticsearch與Solr 選型

ElasticSearch:

Redis：

15天玩轉redis（mark，redis學習系列）

幾款主流 NoSql 數據庫的對比(轉)

Kafka:

Apche Kafka 的生與死 – failover 機制詳解

Kafka消息的可靠性測試--針對直播業務的方案選擇

Kafka文件存儲機制那些事

高可用保證消息絕對順序消費的BROKER設計方案

Kafka 之入門

Kafka 之中級

flume-kafka-storm日誌處理經驗

【採集層】Kafka 與 Flume 如何選擇

使用Java API建立（create），查看（describe），列舉（list），刪除（delete）Kafka主題（Topic）

Flume：

Flume1.5.0入門：安裝、部署、及flume的案例

Flume(NG)架構設計要點及配置實踐： http://shiyanjun.cn/archives/915.html

基於Flume的美團日誌收集系統(一)架構和設計

Storm：

Storm快速理解

從Storm和Spark 學習流式實時分佈式計算的設計

Twitter Storm如何保證消息不丟失

Storm：最火的流式處理框架

使用Storm實現實時大數據分析

Storm ack和fail機制再論

Apache Storm內部原理分析

你瞭解實時計算嗎？

Spark：

Apache Spark源碼走讀之1 -- Spark論文閱讀筆記

Spark 快速理解

論SparkStreaming的數據可靠性和一致性

Spark和Hadoop做業之間的區別

科普Spark，Spark核心是什麼，如何使用Spark（1）

從Storm和Spark 學習流式實時分佈式計算的設計

Spark Streaming：大規模流式數據處理

Docker：

快速理解Docker - 容器級虛擬化解決方案

Scala

Tachyon

Impala

Oozie

oozie 入門

ganglia

.......

分佈式與集羣的區別

大數據(一) - hadoop生態系統及版本演化
大數據(二) - HDFS
大數據(三) - YARN
大數據(四) - MapReduce
大數據(五) - HBase
大數據(六) - ZooKeeper
大數據(七) - Flume
大數據(八) - Sqoop
大數據(九) - Hive
大數據(十) - Pig
大數據(十一) - Mahout
大數據(十二) - Oozie
大數據(十三) - Azkaban
大數據(十四) - Storm
大數據(十五) - JStorm

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。