將來數據庫應具有什麼核心能力?

上週六,咱們開啓了 The Future of Database 系列 的第一期直播,我司 CTO 黃東旭及 Engineering VP 申礫暢聊了「將來的數據庫會是什麼樣?」這個頗具想象力的話題。

如下是第一期直播的部分文字&視頻回顧 Enjoy ~數據庫

視頻連接https://www.bilibili.com/vide...後端

目前業界數據存儲方案存在的問題?

  • 受限的 Scale 能力

    分庫分表和一些「僞分庫分表」的方案,仍然有天花板,帶來了額外的運維和消耗。緩存

  • 碎片化

    回想一下最近幾年後端的技術棧,有 NoSQL、緩存、Kafka、 離線數據倉庫、Hadoop、HBase……不一樣的工具可能面對的是某些特定、甚至「狹窄」的場景,爲了應對一個複雜的業務,你們必然就要多種技術方案組合來覆蓋全部的應用場景。這個過程當中天然會產生「數據孤島」,打通孤島的成本也是巨大的,Kafka 最近幾年這麼火也是正由於存儲方案的多樣致使的「數據孤島」的問題正在顯現。服務器

  • 在線業務與分析脫節

    如今你們構建存儲系統的時候,默認會讓在線業務與離線業務是分開的, 在線業務用 MySQL、MongoDB 等等,離線業務(或者分析系統)用 Hadoop 作數據分析,好像你們都是理所固然的認爲:在線和離線就該這樣,涇渭分明。less

    但目前有個趨勢,分析的場景的需求愈來愈「實時」,或者說高時效的數據分析帶來的業務價值受到重視,這就與你們慣性認知產生了本質的衝突:業務須要當日甚至實時的數據分析結果,但後端只能說今天的數據明天才能導出。還有一個問題是,各個部分維護團隊也是分開的,當業務發生變化時,很難靈活地調整和適應。運維

致使以上這些問題出現的深層共性是:變化永遠比計劃快,你永遠無法預測將來須要多少機器?業務會膨脹到多大?到底須要多「實時」的數據來作決策?ide

有沒有可能存在一個應付更多變化、覆蓋更多場景的系統?從前多是:個人工具箱裏裝了各類型號的錘子(工具軟件),去應對不一樣場景、形狀的釘子,如今可能追求用一個錘子,快速、低成本的解決不一樣的釘子(問題),以不變應萬變工具

Real-Time HTAP 是解藥嗎?

聊到最近幾年數據庫領域的變化,申礫提到最近兩年不少數據庫打出了 HTAP 的標籤,黃東旭分享了本身對「一個真正的 Real-Time HTAP 數據庫」的理解:oop

1-real-time-htap

那麼 Real-Time HTAP 價值在何處?應該在於它是一個簡單、靈活的方案——可以將各個系統/團隊集中在一個 Real-Time HTAP 系統上,節省成本並靈活應對業務變化。大數據

Real-Time HTAP 以後?

Real-Time HTAP 多是當下廠商們可以看獲得的努力方向,那麼在 Real-Time HTAP 以後的將來是什麼呢?

或許五年以後有如下場景:

2-several-scenes

基於這些場景,將來數據庫繞不開的核心能力應該是:智能、彈性調度能力

最近有個新概念是 Serverless,Severless 是伴隨雲(Cloud)誕生的概念。固然 Severless 不是沒有服務器,通俗地說,Serverless 就是會根據你的實際需求狀況,調整數據庫的形態,例如業務流量峯值的時候快速的採購彈性的計算資源進行擴容,低峯的時候自動的釋放多餘的資源。因此能夠把 Severless 當作智能、彈性調度的落地形式來理解,同時將來的數據庫必定是跑在雲上的。

第二期直播預告

主題

會 MySQL 就會大數據 - HTAP 的如今和將來

時間

4 月 18 日 本週六 20:00

主講人

黃東旭,PingCAP 聯合創始人兼 CTO

馬曉宇,PingCAP 實時分析產品負責人

簡介

上週咱們探討了將來的數據庫會走向何方,並透露了 TiDB 4.0 是一個具有將來數據庫雛形的數據庫。「Talk is cheap, show me the TiDB 4.0」 ,本週我司 CTO 黃東旭&實時分析產品負責人馬曉宇將會演示在高寫入的 TP 負載下,如何運行大計算量的分析型請求、而且互相沒有任何肉眼可見的延遲影響(想象一下吧,你的系統能夠一邊下訂單一邊出數據報表),另外還將展現一下其餘的「參考系」在一樣語句下的表現哦~

參與方式

點擊【 這裏 】,添加 TiDB Robot 爲好友,回覆【新特性】進羣參與討論~

相關文章
相關標籤/搜索