大數據纔是將來，Oracle、SQL Server成昨日黃花？

時間 2020-01-01

標籤數據纔是將來 oracle sql server 昨日黃花欄目 Oracle 简体版

原文原文鏈接

1. 引子****數據庫

有人在某個專一SQL的公衆號留言以下：

這個留言觸碰到一個很是敏感的問題：搞關係型數據庫還有前途嗎？如今都2020年了，區塊鏈正火熱，AI人才已經「過剩」，大數據都成了稀鬆日常的蘿蔔白菜，你卻還在搞SQL Server? 你還在搞SQL? 你就是那個被時代淘汰的人!服務器

2. 緣由併發

最近10年，數據管理領域的變化可謂精彩紛呈。什麼Hadoop, Spark，MemcacheDB, Redis, Vertica, HANA, Cassandra, MongoDB, InfluxDB，TiDB等等，不一而足。各種高端峯會、論壇確實只見AI, 大數據，確實不多見傳統關係型數據庫的身影了。分佈式

初步分析下來緣由有四：工具

其一

雲計算的興起跟開源數據庫的大規模應用，大大下降了算力以及數據存儲的成本。
以傳統關係型數據的龍頭老大Oracle爲例，隨着互聯網的興起，海量用戶產生了海量數據，但當Oracle大規模部署的時候，不只Oracle軟件自己貴，與之配套的IBM小型機+EMC的存儲開支也至關龐大。好比Oracle的數據集羣從一個房間搬到另一個房間，收費都要十幾萬。軟硬件維護成本包括對管理員的要求也很是高。oop

另外Oracle自己也有性能的上限，其次是閉源的黑盒子。對於沒碰到過的場景，不管再怎麼努力，也是沒法預測可能出現的問題的。」
中國的互聯網公司大部分都草莽出身，對於性價比極爲看重。當年的互聯網老大美國的雅虎公司開始率先使用MySQL數據庫，中國的互聯網公司隨之跟進。性能

最典型的例子是阿里巴巴。阿里巴巴曾經被稱爲Oracle的「明星客戶「，」黃埔軍校「。但隨着註冊用戶數激增，用戶產生的數據也愈來愈多，淘寶啓用了全亞洲最大的Oracle RAC集羣，阿里巴巴B2B中文站的數據量也因數據量大和業務要求，每一年早上08:00—09:30之間CPU保持98%的使用率，服務器負載也超高，即便採用冷熱隔離的方式也解決不了大容量數據且大併發的難題，更換存儲設備不久也會再次出現這樣的情況。學習

阿里巴巴被迫「攢出」一條去IOE的技術路線：「低成本、線性可控、去中心化（分佈式）：去IBM，PC Sever替代小型機；去Oracle，用MySQL替代；去EMC，用中低端存儲」。
在以後的爆發式增加中，包括以2014，15，16年雙十一爲表明的業務高峯，阿里基於開源版本搞出來的MySQL分支很好地支撐了極其嚴苛的業務要求，最終很方便雲化同時又開源的MySQL在國內的互聯網公司逐步開始取代Oracle的江湖地位，成爲諸多中國互聯網企業的首選。區塊鏈

- 第二大數據

就是通用硬件成本的下降。隨着摩爾定律的做用隨着時間的發展性價比大大的提升。甚至出現了HANA,, Vertica，InfluxDB等等不少內存或者分佈式內存數據庫。
那麼如今雲計算跟雲存儲到底有多便宜呢? 看看今天我剛從某網站截取的廣告吧：

這種面向市場大規模銷售的產品，由於採用能夠採用廉價的PC Server,能夠作到真正的白菜價，這在10年前根本沒法想象。

第三

另外MySQL代碼跟文檔都是公開的，這樣對數據庫開發維護人員的要求相應的也就大大下降了。

最後

從SQL 發展到NoSQL，支持半結構化數據，非結構數據的數據庫大放異彩，以前這類沒法處理的非結構化數據難題獲得瞭解決，非結構化數據處理成爲標準配置，彷佛佔據了市場熱點。

3. 現狀

那麼是否是傳統的關係型數據庫完全成了昨日黃花呢？若是你這麼想，那就大錯特錯了！讓咱們看看權威數據：
咱們能夠看到2013年到2019年，排名前三的基本上是Oracle, MySQL, Microsoft SQL Server，並且是常年大幅度領先。

因而可知非結構化數據雖然火熱，可是關係型數據庫仍然穩坐釣魚臺！

緣由在哪裏呢？數據庫發展絢麗多彩，但最終關鍵還在其擅長的業務場景。不一樣類型的數據庫適配不一樣的業務場景。在現實世界大量存在的結構化數據，關係型數據庫處理起它們來相對成熟，並且各方面優點得天獨厚。如今大火的大數據重點在於其有效解決了以前一直沒法處理的半結構化、非結構化數據這個老大難問題。讓非結構化數據庫擔當關係型數據庫的重任，無異於讓大卡車去跑小轎車拉力賽。

以前關係型數據庫確實佔據了絕對的主流。只是近幾年隨着3G、4G的發展，圖片、音視頻內容略有增長。後面隨着5G、AR\VR、物聯網等等新技術的發展，存儲又會變貴，區塊鏈跟量子計算也會給世界帶來新的變化……

4. 發展