大數據纔是將來,Oracle、SQL Server成昨日黃花?

1. 引子****數據庫

有人在某個專一SQL的公衆號留言以下:
對SQL Server的鄙視
這個留言觸碰到一個很是敏感的問題:搞關係型數據庫還有前途嗎?如今都2020年了,區塊鏈正火熱,AI人才已經「過剩」,大數據都成了稀鬆日常的蘿蔔白菜,你卻還在搞SQL Server? 你還在搞SQL? 你就是那個被時代淘汰的人!服務器

2. 緣由併發

最近10年,數據管理領域的變化可謂精彩紛呈。什麼Hadoop, Spark,MemcacheDB, Redis, Vertica, HANA, Cassandra, MongoDB, InfluxDB,TiDB等等,不一而足。各種高端峯會、論壇確實只見AI, 大數據,確實不多見傳統關係型數據庫的身影了。分佈式

初步分析下來緣由有四:工具

  • 其一

雲計算的興起跟開源數據庫的大規模應用,大大下降了算力以及數據存儲的成本。
以傳統關係型數據的龍頭老大Oracle爲例,隨着互聯網的興起,海量用戶產生了海量數據,但當Oracle大規模部署的時候,不只Oracle軟件自己貴,與之配套的IBM小型機+EMC的存儲開支也至關龐大。好比Oracle的數據集羣從一個房間搬到另一個房間,收費都要十幾萬。軟硬件維護成本包括對管理員的要求也很是高。oop

另外Oracle自己也有性能的上限,其次是閉源的黑盒子。對於沒碰到過的場景,不管再怎麼努力,也是沒法預測可能出現的問題的。」
中國的互聯網公司大部分都草莽出身,對於性價比極爲看重。當年的互聯網老大美國的雅虎公司開始率先使用MySQL數據庫,中國的互聯網公司隨之跟進。性能

最典型的例子是阿里巴巴。阿里巴巴曾經被稱爲Oracle的「明星客戶「,」黃埔軍校「。但隨着註冊用戶數激增,用戶產生的數據也愈來愈多,淘寶啓用了全亞洲最大的Oracle RAC集羣,阿里巴巴B2B中文站的數據量也因數據量大和業務要求,每一年早上08:00—09:30之間CPU保持98%的使用率,服務器負載也超高,即便採用冷熱隔離的方式也解決不了大容量數據且大併發的難題,更換存儲設備不久也會再次出現這樣的情況。學習

阿里巴巴被迫「攢出」一條去IOE的技術路線:「低成本、線性可控、去中心化(分佈式):去IBM,PC Sever替代小型機;去Oracle,用MySQL替代;去EMC,用中低端存儲」。
在以後的爆發式增加中,包括以2014,15,16年雙十一爲表明的業務高峯,阿里基於開源版本搞出來的MySQL分支很好地支撐了極其嚴苛的業務要求,最終很方便雲化同時又開源的MySQL在國內的互聯網公司逐步開始取代Oracle的江湖地位,成爲諸多中國互聯網企業的首選。區塊鏈

- 第二大數據

就是通用硬件成本的下降。隨着摩爾定律的做用隨着時間的發展性價比大大的提升。甚至出現了HANA,, Vertica,InfluxDB等等不少內存或者分佈式內存數據庫。
那麼如今雲計算跟雲存儲到底有多便宜呢? 看看今天我剛從某網站截取的廣告吧:
某網站的雲主機廣告

這種面向市場大規模銷售的產品,由於採用能夠採用廉價的PC Server,能夠作到真正的白菜價,這在10年前根本沒法想象。

  • 第三

另外MySQL代碼跟文檔都是公開的,這樣對數據庫開發維護人員的要求相應的也就大大下降了。

  • 最後

從SQL 發展到NoSQL,支持半結構化數據,非結構數據的數據庫大放異彩,以前這類沒法處理的非結構化數據難題獲得瞭解決,非結構化數據處理成爲標準配置,彷佛佔據了市場熱點。

3. 現狀

那麼是否是傳統的關係型數據庫完全成了昨日黃花呢?若是你這麼想,那就大錯特錯了!讓咱們看看權威數據:
咱們能夠看到2013年到2019年,排名前三的基本上是Oracle, MySQL, Microsoft SQL Server,並且是常年大幅度領先。
數據庫趨勢數據庫排名

因而可知非結構化數據雖然火熱,可是關係型數據庫仍然穩坐釣魚臺!

緣由在哪裏呢?數據庫發展絢麗多彩,但最終關鍵還在其擅長的業務場景。不一樣類型的數據庫適配不一樣的業務場景。在現實世界大量存在的結構化數據,關係型數據庫處理起它們來相對成熟,並且各方面優點得天獨厚。如今大火的大數據重點在於其有效解決了以前一直沒法處理的半結構化、非結構化數據這個老大難問題。讓非結構化數據庫擔當關係型數據庫的重任,無異於讓大卡車去跑小轎車拉力賽。

以前關係型數據庫確實佔據了絕對的主流。只是近幾年隨着3G、4G的發展,圖片、音視頻內容略有增長。後面隨着5G、AR\VR、物聯網等等新技術的發展,存儲又會變貴,區塊鏈跟量子計算也會給世界帶來新的變化……

4. 發展

  • 由單機、集羣向完全分佈式發展,目前Oracle等數據庫已經實現
  • OLTP跟OLAP的融合,這個特性很早就已經實現了
  • 結構化非結構化的融合,目前Oracle, MS SQL Server等也已經實現
  • 磁盤跟內存數據庫的融合,目前Oracle, MS SQL Server等也已經實現
  • 行、列、圖、對象、文檔、內容、時序、搜索引擎、導航類等等不一樣類型的數據庫的融合,筆者初步研究發現已經小部分實現
  • 初略分析來看,數據建模工具對以上特性的支持也在跟進中,但離完美支持還有很大距離

綜上來看,從此縱向上關係型數據庫發展相對成熟,目前其主要在往橫向上發展;非關係型數據庫主要在縱向上進一步作深作透。

5. 結論
無論世界怎麼發展,我認爲關係型數據庫將來十年仍將是主流,再遠的未來也會有它重要的地位。由於在可預見的未來,結構化數據還是人類最重要的數字資產,關係型數據庫也就會佔據最重要的位置。

因此實質就是:不是關係型數據庫不重要,而是沒有太多新東西能夠講;非結構化數據還有很大發展空間,因此你們比較關注。

光看什麼熱鬧學什麼,什麼火學什麼,浮躁的心態會讓人技術很難學得深刻。相關從業者得搞清楚這個世界到底發生了什麼,之後會發生什麼。另外關鍵是得選準方向,坐得下來,鑽得進去。

關注我,每週一篇文章學習數據相關的知識。

相關文章
相關標籤/搜索