目錄:編程
「就像望遠鏡讓咱們可以感覺宇宙,顯微鏡讓咱們可以觀測微生物同樣,大數據正在改變咱們的生活以及理解世界的方式……」。安全
大數據的4V特徵-來源架構
公司的「大數據」併發
隨着公司業務的增加,大量和流程、規則相關的非結構化數據也爆發式增加。好比:負載均衡
一、業務系統如今平均天天存儲20萬張圖片,磁盤空間天天消耗100G;分佈式
二、平均天天產生簽約視頻文件6000個,每一個平均250M,磁盤空間天天消耗1T;函數式編程
……函數
「草船借箭」和大數據有什麼關係呢?對天象的觀察是基於一種對風、雲、溫度、溼度、光照和所處節氣的綜合分析這些數據來源於多元化的「非結構」類型,而且數據量較大,只不過這些數據輸入到的不是電腦,而是人腦並最終經過計算分析得出結論。高併發
Hadoop體系架構oop
Hadoop核心設計
HDFS介紹-文件讀流程
Hbase——分佈式數據存儲系統
Client:使用HBase RPC機制與HMaster和HRegionServer進行通訊
Zookeeper:協同服務管理,HMaster經過Zookeepe能夠隨時感知各個HRegionServer的健康情況
HMaster: 管理用戶對錶的增刪改查操做
HRegionServer:HBase中最核心的模塊,主要負責響應用戶I/O請求,向HDFS文件系統中讀寫數據
HRegion:Hbase中分佈式存儲的最小單元,能夠理解成一個Table
HStore:HBase存儲的核心。由MemStore和StoreFile組成。
HLog:每次用戶操做寫入Memstore的同時,也會寫一份數據到HLog文件
還有哪些NoSQL產品?
一個高併發網站的DB進化史
關係模型>聚合數據模型的轉換-基本變換
關係模型>聚合數據模型的轉換-內嵌變換
關係模型>聚合數據模型的轉換-分割變換
關係模型>聚合數據模型的轉換-內聯變換
Hadoop2.0
MapReduce:
JobTracker:協調做業的運行。
TaskTracker:運行做業劃分後的任務。
大數據的技術領域
騰訊大數據現狀(資料來自2014.4.11 騰訊分享日大會)
騰訊大數據平臺產品架構
騰訊大數據平臺與業務平臺的關係
公司數據處理平臺的基礎架構
公司大數據平臺架構圖
應用一數據分析
應用二視頻存儲
應用三離線日誌分析