PC端的這個右側的目錄找東西確實好找點,我每次寫也很是注意看這塊排版工不工整🤣,用這裏去直接跳到對應的內容真的還算方便,因此就想着作個目錄,之後若是寫了新的,也會在這篇寫上標題。node
按照不一樣技術框架的劃分形式。已經有寫過的就寫上,沒寫過的就先空着。算法
內容概要:block的概念與副本、機架存儲策略、三大組件:NameNode,DataNode,SecondaryNamenode、元數據metaData、心跳機制和負載均衡機制sql
內容概要:HDFS的讀寫流程,hadoop HA高可用,聯邦,存儲小文件時的HAR和Sequence File網絡
內容概要:mapper和reducer代碼、shuffle、二排、數據傾斜的判斷和減緩數據結構
內容概要:全是理論性的東西。yarn的應用場景、核心組件、應用調度過程、yarn的典型應用併發
zookeeper寫的時候姑且是按照Java的套路去寫的,和大數據的操做扯不上關係,以後可能會進行相應的補充app
內容概要:包括zookeeper的簡介和特徵,會話機制、znode的數據構成和節點類型,還有zk的監聽機制負載均衡
內容概要:鎖的特徵,zkClient的使用、使用節點不可重名+watch機制實現分佈式鎖、使用取號 + 最小號取lock + watch原理實現分佈式鎖框架
內容概要:僞集羣形式的zookeeper的集羣搭建,集羣鏈接和監控,paxos算法的解釋說明、zookeeper的leader選舉機制運維
內容概要:ZAB協議的介紹,數據同步,丟棄事務,leader崩潰恢復、zookeeper的分佈式隊列的實現邏輯及代碼實現
內容概要:配置中心的介紹,數據結構,代碼實現
內容概要:master選舉和zookeeper的相關實現、官網本身的一個瀏覽過程
內容概要:簡單過了一遍RPC是什麼,三個過程,爲何咱們須要它,它的特性和適用場景,RPC的流程及協議定義還有它的框架的一些小知識
內容概要:RPC的流程和任務分析及代碼實現,附帶過程優化,優化部分推薦先直接跳轉總圖查看
內容概要:如題,NameNode啓動流程分析,思路爲驗證NameNode是否是一個RPC的服務端
內容概要:如題,DataNode啓動流程分析,思路也是驗證它是不是RPC的客戶端,還有Hadoop HA高可用方案原理
說到它就巨頭痛。Spark是很是多東西的,有基礎,有spark core,有spark sql,有spark streaming
內容概要:Kafka中的一些基礎角色的介紹,topic,partition,producer,consumer,message,副本,消費者組,controller、kafka和zookeeper的配合,kafka的順序寫和零拷貝,日誌分段存儲機制和kafka的三層網絡模型
內容概要:這篇並非在說概念,而是說一些集羣的參數考量方面、集羣搭建的重要參數、集羣的簡單操做和一些客戶端
內容概要:生產者原理(ProducerRecord,Partitioner、緩衝區和Sender線程),生產者的代碼及一些調優參數
內容概要:生產者的一個小案例實現及消費者原理(offset,coordinator),消費者代碼及核心參數
內容概要:LEO&HW更新原理,kafka運行的總流程梳理,源碼的閱讀環境
內容概要:傳統IO和NIO的區別,NIO(buffer,channel,selector、pipe)的介紹及阻塞性與非阻塞性網絡通訊的代碼演示,主要是爲了Kafka源碼準備
和Spark Streaming屬於計算類框架,看狀況
即便前方仍舊荊棘叢生,但是咱們沒有理由放棄奔跑···
這個flag不管對於你我來講都是一個考驗,在第一篇HDFS的時候,就說過了這雖然是相似於一份學習筆記,但是絕對有頭有尾,會用最清晰明瞭的語言來描述知識點,但願你們也能有所收穫。以這個目錄爲證,相信我必定能說到作到。