隨着國內首款Cloud Native自研數據庫POLARDB精彩亮相ICDE 2018的同時,做爲其核心支撐和使能平臺的PolarFS文件系統的相關論文"PolarFS: An Ultra-low Latency and Failure Resilient Distributed File System for Shared Storage Cloud Database"也被數據庫頂級會議VLDB 2018錄用。8月,阿里雲數據庫團隊亮相於巴西里約召開的VLDB 2018,對整個業界起到了很是積極的影響。數據庫
VLDB(Very Large Data Base)和另外兩大數據庫會議SIGMOD、ICDE構成了數據庫領域的三個頂級會議。VLDB國際會議於1975在美國的弗雷明漢馬 (Framingham MA) 成立,是數據庫研究人員,供應商,參與者,應用開發者,以及用戶一年一度的頂級國際論壇。服務器
VLDB主要由四個主題構成,分別爲:Core Database Technology (核心數據庫技術),Infrastructure for Information Systems (基礎設施信息系統),Industrial Applications and Experience (工業應用與經驗) 以及 Experiments and Analyses(實驗和分析)。網絡
從09年至今的數據分析來看,VLDB的論文接受率整體是比較低,其中,核心數據庫主題中的論文接受率大概爲16.7%;基礎設施信息系統方面的論文接受率大約爲17.9%;工業應用與經驗的論文接收比例近視爲18%;而實驗和分析部分的爲19%左右。因而可知,論文被VLDB接收不是件容易的事情,必須是創新性很高,貢獻很大的論文才有機會被錄用。架構
本文着重介紹PolarFS的系統設計與實現。數據庫設計
如同Oracle存在與之匹配的OCFS2,POLARDB做爲存儲與計算分離結構的一款數據庫,PolarFS承擔着發揮POLARDB特性相當重要的角色。PolarFS是一款具備超低延遲和高可用能力的分佈式文件系統,其採用了輕量的用戶空間網絡和I/O棧構建,而棄用了對應的內核棧,目的是充分發揮RDMA和NVMe SSD等新興硬件的潛力,極大地下降分佈式非易失數據訪問的端到端延遲。目前,PolarFS的3副本跨節點寫入的訪問總延遲已經很是接近單機本地PCIe SSD的延遲水平,成功地使得POLARDB在分佈式多副本架構下仍然可以發揮出極致的性能。分佈式
針對數據庫設計分佈式文件系統會帶來如下幾點好處:性能
計算節點和存儲節點能夠使用不一樣的服務器硬件,並能獨立地進行定製。例如,計算節點不須要考慮存儲容量和內存容量的比例,其嚴重依賴於應用場景而且難以預測。大數據
多個節點上的存儲資源可以造成單一的存儲池,這能下降存儲空間碎化、節點間負載不均衡和空間浪費的風險,存儲容量和系統吞吐量也能容易地進行水平擴展。阿里雲