讀書筆記-大型分佈式網站架構-設計與實踐【陳康賢】

1. 面向服務的體系架構(SOA)

HTTP協議的工做方式與HTTP網絡協議棧的結構前端

如何實現基於HTTP協議和TCP協議的RPC調用,它們之間的有何差異,分別適應何種場景算法

如何實現服務的動態註冊和路由,以及軟負載均衡的實現shell

1.1 基於TCP協議的RPC

1.2 基於HTTP協議的RPC

1.3 服務的路由和負載均衡

1.4 HTTP服務網關

2. 分佈式系統基礎設施

分佈式緩存memcache的使用及分佈式策略,包括Hash算法的選擇數據庫

常見的分佈式系統存儲解決方案,包括MySQL的分佈式拓展、HBase的API及使用場景、Redis的使用等緩存

如何使用分佈式消息系統ActiveMQ來下降系統之間的耦合度,以及進行應用間的通訊安全

垂直化的搜索引擎在分佈式系統中的使用,包括搜索引擎的基本原理、Lucene詳細的使用介紹,以及基於Lucene的開源搜索引擎工具Solr使用性能優化

2.1 分佈式緩存

2.2 持久化存儲

2.3 消息系統

2.4 垂直化搜索引擎

2.5 其餘基礎設施

3. 互聯網安全架構

場景的Web攻擊手段和防護方法,如XSS、CRSF、SQL注入等網絡

常見的一些安全算法,如數字摘要、對稱加密、非對稱加密、數字簽名、數字證書等架構

如何採用摘要認證方式防止信息篡改、經過數字簽名驗證通訊雙方的合法性,以及經過HTTPS協議保障通訊過程當中數據不被第三方監聽和截獲併發

在開放平臺系統下,OAuth協議如何保障ISV對數據的訪問是通過受權的合法行爲

3.1 常見的Web攻擊手段

3.2 經常使用的安全算法

3.3 摘要認證

3.4 簽名認證

3.5 HTTPS協議

3.6 OAuth協議

4. 系統穩定性

經常使用的在線日誌分析命令的使用和日誌分析腳本的編寫,如cat、grep、wc、less等命令的使用,以及awk、shell腳本的編寫

如何進行集羣的監控,包括監控指標的定義、心跳檢測、容量評估等

如何保障高併發系統的穩定進行,如採用流量控制、依賴管理、服務分級、開關等策略,以及介紹如何涉及高併發系統

如何優化應用的性能,包括前端優化、Java程序優化、數據庫查詢優化等

如何進行Java應用故障的在線排查,包括一系列排查工具的使用,以及一些實際案例的介紹等

4.1 在線日誌分析

4.2 集羣監控

4.3 流量控制

4.4 性能優化

4.5 Java應用故障的排查

5. 數據分析

分佈式系統中日誌收集系統的框架

如何經過Storm進行實時的流式數據分析

如何經過Hadoop進行離線數據分析,經過Hive簡歷數據倉庫

如何將關係性數據庫中存儲的數據導入HDFS,以及從HDFS中將數據導入關係型數據庫

如何將分析好的數據經過圖形展現給用戶

5.1 日誌收集

5.2 離線數據分析

5.3 流式數據分析

5.4 數據同步

5.5 數據報表

相關文章
相關標籤/搜索