將來數據庫應具有什麼核心能力？

時間 2020-04-17

標籤將來數據庫應具什麼核心能力欄目 SQL 简体版

原文原文鏈接

上週六，咱們開啓了 The Future of Database 系列的第一期直播，我司 CTO 黃東旭及 Engineering VP 申礫暢聊了「將來的數據庫會是什麼樣？」這個頗具想象力的話題。
如下是第一期直播的部分文字&視頻回顧 Enjoy ~數據庫

視頻連接：https://www.bilibili.com/vide...後端

目前業界數據存儲方案存在的問題？

受限的 Scale 能力
分庫分表和一些「僞分庫分表」的方案，仍然有天花板，帶來了額外的運維和消耗。緩存
碎片化
回想一下最近幾年後端的技術棧，有 NoSQL、緩存、Kafka、離線數據倉庫、Hadoop、HBase……不一樣的工具可能面對的是某些特定、甚至「狹窄」的場景，爲了應對一個複雜的業務，你們必然就要多種技術方案組合來覆蓋全部的應用場景。這個過程當中天然會產生「數據孤島」，打通孤島的成本也是巨大的，Kafka 最近幾年這麼火也是正由於存儲方案的多樣致使的「數據孤島」的問題正在顯現。服務器
在線業務與分析脫節
如今你們構建存儲系統的時候，默認會讓在線業務與離線業務是分開的，在線業務用 MySQL、MongoDB 等等，離線業務（或者分析系統）用 Hadoop 作數據分析，好像你們都是理所固然的認爲：在線和離線就該這樣，涇渭分明。less

但目前有個趨勢，分析的場景的需求愈來愈「實時」，或者說高時效的數據分析帶來的業務價值受到重視，這就與你們慣性認知產生了本質的衝突：業務須要當日甚至實時的數據分析結果，但後端只能說今天的數據明天才能導出。還有一個問題是，各個部分維護團隊也是分開的，當業務發生變化時，很難靈活地調整和適應。運維

致使以上這些問題出現的深層共性是：變化永遠比計劃快，你永遠無法預測將來須要多少機器？業務會膨脹到多大？到底須要多「實時」的數據來作決策？ide

有沒有可能存在一個應付更多變化、覆蓋更多場景的系統？從前多是：個人工具箱裏裝了各類型號的錘子（工具軟件），去應對不一樣場景、形狀的釘子，如今可能追求用一個錘子，快速、低成本的解決不一樣的釘子（問題），以不變應萬變。工具

Real-Time HTAP 是解藥嗎？

聊到最近幾年數據庫領域的變化，申礫提到最近兩年不少數據庫打出了 HTAP 的標籤，黃東旭分享了本身對「一個真正的 Real-Time HTAP 數據庫」的理解：oop

那麼 Real-Time HTAP 價值在何處？應該在於它是一個簡單、靈活的方案——可以將各個系統/團隊集中在一個 Real-Time HTAP 系統上，節省成本並靈活應對業務變化。大數據

Real-Time HTAP 以後?

Real-Time HTAP 多是當下廠商們可以看獲得的努力方向，那麼在 Real-Time HTAP 以後的將來是什麼呢？

或許五年以後有如下場景：

基於這些場景，將來數據庫繞不開的核心能力應該是：智能、彈性調度能力。

最近有個新概念是 Serverless，Severless 是伴隨雲（Cloud）誕生的概念。固然 Severless 不是沒有服務器，通俗地說，Serverless 就是會根據你的實際需求狀況，調整數據庫的形態，例如業務流量峯值的時候快速的採購彈性的計算資源進行擴容，低峯的時候自動的釋放多餘的資源。因此能夠把 Severless 當作智能、彈性調度的落地形式來理解，同時將來的數據庫必定是跑在雲上的。

第二期直播預告

主題

會 MySQL 就會大數據 - HTAP 的如今和將來

時間

4 月 18 日本週六 20:00

主講人

黃東旭，PingCAP 聯合創始人兼 CTO

馬曉宇，PingCAP 實時分析產品負責人

簡介

上週咱們探討了將來的數據庫會走向何方，並透露了 TiDB 4.0 是一個具有將來數據庫雛形的數據庫。「Talk is cheap, show me the TiDB 4.0」，本週我司 CTO 黃東旭&實時分析產品負責人馬曉宇將會演示在高寫入的 TP 負載下，如何運行大計算量的分析型請求、而且互相沒有任何肉眼可見的延遲影響（想象一下吧，你的系統能夠一邊下訂單一邊出數據報表），另外還將展現一下其餘的「參考系」在一樣語句下的表現哦~