當前,整個互聯網正在從IT時代向DT時代演進,大數據技術也正在助力企業和公衆敲開DT世界大門。當今「大數據」一詞的重點其實已經不只在於數據規模的定義,它更表明着信息技術發展進入了一個新的時代,表明着爆炸性的數據信息給傳統的計算技術和信息技術帶來的技術挑戰和困難,表明着大數據處理所需的新的技術和方法,也表明着大數據分析和應用所帶來的新發明、新服務和新的發展機遇。 爲了幫助你們更好深刻了解大數據,雲棲社區組織翻譯了GitHub Awesome Big Data資源,供你們參考。本資源類型主要包括:大數據框架、論文等實用資源集合。 資源列表:
- 關係數據庫管理系統(RDBMS)
- 框架
- 分佈式編程
- 分佈式文件系統
- 文件數據模型
- Key -Map 數據模型
- 鍵-值數據模型
- 圖形數據模型
- NewSQL數據庫
- 列式數據庫
- 時間序列數據庫
- 類SQL處理
- 數據攝取
- 服務編程
- 調度
- 機器學習
- 基準測試
- 安全性
- 系統部署
- 應用程序
- 搜索引擎與框架
- MySQL的分支和演化
- PostgreSQL的分支和演化
- Memcached的分支和演化
- 嵌入式數據庫
- 商業智能
- 數據可視化
- 物聯網和傳感器
- 文章
- 論文
- 視頻
關係數據庫管理系統(RDBMS)
框架
分佈式編程
分佈式文件系統
文件數據模型
Key Map 數據模型 注意:業內存在一些術語混亂,有兩個不一樣的東西都叫作「列式數據庫」。這裏列出的有一些是圍繞「key-map」數據模型而建的分佈式、持續型數據庫,其中全部的數據都有(可能綜合了)鍵,並與映射中的鍵-值對相關聯。在一些系統中,多個這樣的值映射能夠與鍵相關聯,而且這些映射被稱爲「列族」(具備映射值的鍵被稱爲「列」)。php 另外一組也可稱爲「列式數據庫」的技術因其存儲數據的方式而有別於前一組,它在磁盤上或在存儲器中——而不是以傳統方式,即全部既定鍵的鍵值都相鄰着、逐行存儲。這些系統也彼此相鄰來存儲全部列值,可是要獲得給定列的全部值卻不須要之前那麼繁複的工做。html 前一組在這裏被稱爲「key map數據模型」,這二者和Key-value 數據模型之間的界限是至關模糊的。後者對數據模型有更多的存儲格式,可在列式數據庫中列出。若想了解更多關於這兩種模型的區分,可閱讀Daniel Abadi的博客:Distinguishing two major types of Column Stores。mysql
鍵-值數據模型
圖形數據模型
NewSQL數據庫
|