全面雲化的時代已經到來,面對一系列的新技術和挑戰,數據庫市場將面臨怎樣的變革?做爲雲服務提供商,如何幫助更多的企業級用戶把握「雲」潮,提供最高效、最具價值的數據庫解決方案?數據庫
日前,在阿里雲峯會·北京站的數據庫專場上,阿里巴巴集團副總裁、達摩院首席數據庫科學家、阿⾥雲智能事業羣數據庫產品事業部總負責⼈李飛飛針對下一代雲原生數據庫的技術與挑戰進行了精彩分享。安全
根據DB-Engine 2019年1月份的數據庫市場趨勢分析,關係型數據庫依舊佔據着最核心的市場份額。與此同時,數據庫市場也在不斷細分,圖數據庫、文檔數據庫以及NoSQL等數據庫細分市場正在崛起。網絡
另外一大趨勢則是:以Oracle、DB2和Microsoft SQL Server三大巨頭爲表明的傳統商業數據庫所佔據的市場份額不斷降低,而開源和第三方數據庫市場持續增加。架構
數據庫技術誕生至今,雖然已經歷40多年的發展歷程,但仍舊處於蓬勃發展的時期。現在,各大雲計算廠商也達成了共識:數據庫是鏈接IaaS和雲上智能化應用的重要組成部分,所以從數據的產生、存儲以及消費等各個環節,雲產商都須要提高全鏈路的能力,進而知足用戶鏈接IaaS和智能化應用的需求。併發
隨着數據庫技術的不斷髮展,不只出現了OLTP系統來實現事務的處理,能夠實現對交易數據的實時記錄;還出現了OLAP系統,藉助OLAP系統可實現對於海量數據的實時分析。除此以外,還須要各種的數據庫服務和管控工具支持核心的OLTP和OLAP系統。在此基礎之上,針對半結構化數據和非結構化數據,NoSQL數據庫解決方案應運而生。機器學習
上世紀70年代末到80年代初,誕生了關係型數據庫,產生了SQL查詢語言以及OLTP交易處理系統。隨着數據的爆發式增加以及複雜分析需求的出現,誕生了數據倉庫,以及OLAP在線分析處理系統以及ETL等數據處理技術。分佈式
技術發展到今天,圖、文檔以及時空、時序等多元異構數據量持續增加,所以也對應地出現了關係型數據庫以外的NoSQL和NewSQL數據庫系統。高併發
傳統數據庫每每採用單節點架構,而到了現在的雲原生時代,雲原生數據庫一般會採用共享存儲的架構方式。阿里雲POLARDB所採用的就是共享存儲架構,經過高速網絡構建共享存儲,在此之上實現存儲與計算的分離,進而能夠快速彈性擴容出多個計算節點。工具
與此同時,POLARDB還能夠根據用戶的具體需求在存儲和計算兩個維度迅速地實現擴縮容。而對於用戶而言,無需修改任何業務邏輯,就可使用基於共享存儲的POLARDB數據庫,能夠實現無侵入式遷移。佈局
除了雲原生的共享存儲技術以外,面對高併發、海量數據訪問的挑戰,也須要藉助分佈式架構來解決,好比爲了應對每一年的雙11大促,阿里巴巴自身就須要去探索分佈式架構。
此外,針對數據的多模多態需求,阿里雲也但願在用戶側提供不一樣查詢接口,好比SQL。在存儲側,阿里雲但願可以支持用戶將數據存儲到不一樣地方,並經過像SQL這樣的統一接口實現對不一樣數據類型的統一查詢訪問。目前,阿里雲所提供數據湖服務就是針對上述場景所演進來的雲原生技術。
正如前面所提到的OLTP和OLAP系統,傳統的解決方案但願將讀寫衝突隔離開,讓OLTP負責事務處理,讓OLAP負責海量數據的分析任務。而在雲原生時代,阿里雲會藉助新硬件所帶來的技術紅利,儘量下降數據遷移的成本,將事務處理和數據分析整合在同一個引擎中,經過一套系統爲用戶無縫解決兩種問題。
阿里雲目前已經服務了大量企業級客戶,這些客戶經過虛擬化、存儲與計算分離來使用阿里雲所提供的雲資源池。所以,咱們須要對於雲上所有資源進行智能化監控和調配,作到快速響應,而且爲用戶提供最高質量的服務。而智能化的背後須要利用機器學習以及人工智能技術,從數據遷移、數據保護、彈性調度等各個維度實現自感知、自決策、自恢復以及自優化。
在雲原生時代,另一個重要技術就是軟硬件一體化設計。新硬件的發展爲數據庫系統帶來了許多可不斷利用的技術紅利,好比RDMA網絡、SSD、NVM、GPU、IPG加速等。阿里雲的POLARDB共享存儲就利用了RDMA網絡,所以能夠作到像本地節點同樣快速訪問遠程數據庫節點。
對於不少雲上的客戶而言,可能也有金融級高可用的需求。利用高可用協議,阿里雲數據庫能夠採用三副本架構,在本地能夠實現數據庫之間的無縫實時切換,在異地也能夠知足不一樣用戶對於災備的需求,藉助Binlog技術實現異地數據同步,實現金融級高可用。此外,雲上用戶對數據的安全性尤其看重,阿里雲數據庫服務從數據落盤開始,就提供了加密技術,確保全鏈路的數據安全。
阿里雲數據庫所提供的工具類產品包括數據備份、數據遷移、數據管理、混合雲數據管理以及智能化診斷與優化系統等,能夠幫助客戶實現快速上雲而且打造混合雲解決方案。
咱們提供的核心引擎產品中,既有自主可控的自研產品,也有第三方以及開源的產品。但願經過商業數據庫以及開源產品爲用戶提供豐富的選擇,同時也但願將雲計算的技術紅利整合到自研數據庫產品中去,進一步作深作透,真正地幫助客戶解決應用第三方或者開源數據庫所沒法解決的痛點和問題。
在OLTP方向,阿里雲數據庫所提供的核心產品是POLARDB以及其分佈式版本POLARDB X。除此以外,阿里雲也提供主流的MySQL、PostgreSQL、SQLServer以及針對於Oracle兼容的PPAS等一系列服務。
針對OLAP系統,咱們的核心產品是AnalyticDB、針對多源異構數據所提供的數據湖服務DLA,以及針對IoT場景的時序時空數據庫TSDB。而在NoSQL領域,阿里雲則提供了豐富的第三方數據庫產品供客戶選擇,好比HBase、Redis、MongoDB以及阿里雲自研的圖數據庫GDB等。
阿里雲數據庫的管控平臺與全鏈路監控服務爲用戶提供了智能化的全鏈路檢測與分析,保障阿里雲數據庫可以爲用戶提供最高級別的Service Level。
阿里雲幫助客戶打造了一條線上線下混合雲數據存儲的鏈路,從客戶遷移上雲開始,其能夠選擇阿里雲DTS服務進行實時的數據上傳和同步。數據上雲以後,客戶可選擇POLARDB等雲原生數據庫產品進行存儲,也能夠藉助DLA或者AnalyticDB等產品進行數據分析。
而針對特定場景進行數據分析能夠選用文檔數據庫、圖數據庫或者時序時空數據庫等解決方案,能夠藉助DTS系統實現線上線下的數據同步備份,而且還能夠藉助HDM來進行混合雲數據庫管理。此外,阿里雲數據庫服務還提供了數據庫管理套件,能夠支撐用戶對數據庫進行管理和開發,使得管理和開發流程更爲高效。
這裏主要爲你們介紹兩種雲原生數據庫產品,POLARDB和AnalyticDB。
POLARDB
POLARDB利用RDMA網絡實現了高效的共享分佈式存儲,藉助於共享存儲技術,多個計算節點中能夠實現「一寫多讀」,而且能夠根據客戶的工做量需求,快速彈出多個只讀節點來知足客戶在高峯時刻對於計算的需求,同時也能夠在存儲節點上實現快速縮擴容。
針對客戶的應用場景以及其業務峯值峯谷的波動狀況,POLARDB能夠作到按量按需使用和計費,進而大大地提高了客戶的數據庫使用效率,節省了所須要成本。整體而言,POLARDB就是一個超級MySQL,後續POLARDB還會陸續推出兼容PostgreSQL和Oracle的版本。
在一些場景下,用戶須要面對高併發和海量數據訪問的挑戰,所以須要突破共享存儲的容量上限。分佈式架構的POLARDB X則利用Sharding Partition解決方案實現了存儲容量的無限水平擴展。POLARDB X分佈式版本也會在後續進行公測,歡迎你們試用。
AnalyticDB
對海量數據進行分析的時候,讀寫會產生必定的衝突。若是須要讀取大量數據並進行分析將會極爲複雜,所以推薦你們使用阿里雲的實時交互式分析數據庫系統AnalyticDB。
AnalyticDB最核心的特色是具備支持高吞吐寫入的能力,而且具備針對於行列存儲所研發的存儲引擎,所以能夠實現實時的交互式分析。在海量數據以及高併發場景下,AnalyticDB在響應時間方面的表現都很是優秀。AnalyticDB兼容了MySQL生態,所以能夠將MySQL裏面的數據直接導入AnalyticDB中,能夠實現對上百億級別的數據的毫秒級查詢以及百萬TPS級別的寫入。
數據傳輸雲服務DTS
除了核心的雲原生數據庫產品,咱們還有多款數據庫工具型產品,好比數據傳輸雲服務DTS。DTS所解決的痛點是雲下客戶上雲所須要進行的數據傳輸問題,以及其在上雲以後,雲上與雲下數據庫或者從TP到AP系統之間進行實時的數據同步問題。
利用DTS,用戶能夠實現快速、高效地增量數據同步,保證了實時數據一致。DTS還提供了數據訂閱能力,能夠經過不一樣的協議和接口來接入更多不一樣的數據源。
這裏爲你們介紹一款阿里雲新的數據庫產品——阿里雲圖數據庫GDB,該產品目前正在阿里雲官網進行公測。GDB是一種支持屬性圖模型,用於處理高度鏈接數據查詢與存儲的實時可靠的在線數據庫,其利用了大量的雲原生技術,好比存儲與計算分離等。GDB支持標準的圖查詢語言,兼容Gremlin語法,這一點與市場主流的圖數據庫保持一致。
GDB另一個最核心的特色就是支持實時更新、支持OLTP級別的數據一致性,可以幫助你們在對海量的屬性圖進行分析存儲時保證數據的一致性。GDB具備服務高可用、易於維護等雲原生數據庫產品的特性。比較典型的應用場景有社交網絡、金融欺詐檢測、實施推薦等,同時GDB還支持知識圖譜等形態以及神經網絡等。
阿里雲數據庫團隊的目標是爲客戶提供企業級的雲原生數據庫服務,利用自身全域佈局、自主可控的技術爲企業客戶提供快速數據上雲、雲上雲下統一數據管理以及數據安全等服務。
舉例而言,阿里雲數據庫服務目前在杭州等城市支撐了像城市大腦這樣複雜的應用,其既須要存儲結構化數據也須要存儲非結構數據,而且對於OLTP、OLAP、工具類產品等都提出了巨大的挑戰,而藉助阿里雲AnalyticDB、POLARDB、DTS等利用了雲原生技術的產品能夠無縫地支撐城市大腦這樣的複雜應用場景。
以POLARDB爲例,該產品於2018年8月份進行公測,2018年的年末進行商業化,到目前爲止實現了在公有云平臺上的快速增加。POLARDB呈現快速增加背後的核心緣由就是阿里雲真正地幫助客戶解決自身的痛點問題,不是利用新技術來「造完錘子找釘子」,而是真正地「看到釘子再去造錘子」。
POLARDB最爲核心的特色就是雲原生、分鐘級別的彈性存儲和計算、高性價比、靈活彈性的使用計費方式、高併發能力,可快速擴容多個只讀節點、大容量支持、經過共享分佈式存儲作到了相似單機數據庫的體驗,對用戶的業務邏輯無侵入,而且高度兼容MySQL。
AnalyticDB則是一個實時交互式分析系統,不管是自制數據仍是從大數據系統中獲取的存儲數據,均可以藉助DTS工具將其遷移到AnalyticDB集羣上,進行深刻的商業分析、可視化以及交互式查詢等。
AnalyticDB可以支持上百個表的鏈接查詢,可爲客戶提供毫秒級的查詢服務。現在,無數用戶正在阿里雲上使用POLARDB和AnalyticDB這樣的雲原生數據庫,雲原生數據庫也正在真正地改變客戶在應用中所遇到的痛點,爲他們帶來更多的業務價值。
總結而言,雲原生時代出現了一系列的新技術和新挑戰。面對這些挑戰,須要對於數據庫內核產品、管控平臺以及數據庫工具進行有機整合,纔可以爲客戶提供最高效、最具備價值的解決方案。阿里雲誠摯地邀請你們體驗自身的產品和技術,但願可以與更多的客戶一塊兒合做,解決問題,也但願更多的開發者和生態合做夥伴可以基於阿里雲的數據庫服務和產品打造針對特定行業和領域的深度解決方案,使得雲原生時代的數據庫市場更加繁榮。
本文做者:七幕
本文爲雲棲社區原創內容,未經容許不得轉載。