誼品生鮮:放棄傳統數據庫架構,全站上阿里雲

疫情之下,生鮮電商的訂單忽然暴漲。數據庫

社區生鮮龍頭企業誼品生鮮就是一個典型表明。它的在線交易量激增,日訂單量超過10萬單。小程序

對電商企業而言,這對業務是個巨大的好消息;但對於IT、對於誼品生鮮的核心業務系統則是一個巨大的挑戰!安全

全部作互聯網、作電商核心業務系統的技術人員都知道,訪問量容量巨增,這對於後臺系統會帶來各類不可預知的問題:性能卡頓,網站、APP、小程序等入口不能訪問,訂單出錯,支付不了……服務器

要命的是,出現其中的任何一個問題,都會對業務、對用戶體驗、對品牌形成巨大傷害。架構

更進一步,萬一出現了某個問題(說實話,這世界誰也不能保證100%不會出現),而IT卻不能快速解決,將會是災難性的後果。負載均衡

做爲誼品生鮮IT基礎架構的負責人,楊航深知其中滋味。運維

但幸運的是,他告訴中國軟件網,此次他闖過來了。機器學習

而記者也發現,他的闖關經歷,或許是電商企業、甚至是互聯網公司應對業務量暴增的、實現可控、健康運營的「最佳實踐」。分佈式

01 傳統ERP被廠商卡脖子工具


爲應對業務的快速擴張,2018年年末,誼品生鮮成立了研發團隊。同時,開始大量採購第三方系統,例如ERP、倉儲、供應鏈等。

這些系統都基本上是本地部署,本身買服務器,數據庫基本都採用Oracle。

這些第三方業務系統每每有一個共同的特色,即核心業務邏輯每每都寫在Oracle數據庫裏。

這就帶來了一個巨大的風險:一旦系統出了問題,誼品生鮮本身的技術人員每每沒法解決,必需要有系統研發廠商的DBA等相關技術人員協助才能解決。

據阿里雲數據庫資深技術專家、數據庫自治服務DAS產品線負責人李廣望介紹,這實際上是不少電商企業面臨的一個典型場景。

這種傳統的數據庫架構,最怕系統出問題。由於一出問題時,本身無法解決,必須依靠廠商的技術人員才能解決。

但因爲廠商的技術人員不可能立刻響應,也不可能當即到現場解決,這種狀況下解決一個問題須要花費很長時間。

這對於每分鐘都有巨大業務量的互聯網企業而言,這絕對是不能忍受的。

例如,誼品生鮮有次進行門店盤點,卻出現沒辦法提交盤點成果的現象。誼品技術人員很快排查發現,緣由是系統的Oracle數據庫阻塞了。

「這涉及到第三方系統,咱們本身的技術人員沒法解決。必需要找ERP廠商,讓他們的DBA來處理。」

當時解決這個問題,花了很長時間。這給誼品生鮮帶來了極大的損失。

對於電商企業而言,這種狀況實際上是「被廠商卡住了脖子」。本身有技術人員,卻沒法衝上去解決問題。

這個問題必須解決。不然,電商業務系統的可靠性與穩定運行將有巨大的不可控風險。

02採用雲原生架構自研系統


從阿里巴巴、京東、百度、美團等互聯網企業的實踐來看,中國軟件網發現,解決這個問題的根本途徑就是——自已研發核心業務系統。

若是採用第三方系統,永遠存在不可控的風險。

而對於互聯網企業,核心業務系統是本身的命根子。它必須絕對可控,容不得有半點閃失。

要絕對可控,就必須本身研發系統。

另外,每一個互聯網或電商企業,其實都有獨特的供應鏈模式、運營模式。市場上很難找到一個第三方系統可以很好地支撐他們的運營。

就像誼品生鮮,在開始的三年,因爲需求沒法知足的緣由曾經換過幾個系統。

每次換系統都是一個很是痛苦的過程。這也是誼品生鮮決定成立本身的研發中心,本身的研發系統的關鍵緣由。

所以,誼品生鮮下定決心本身組建專門的IT研發團隊,自已研發核心業務系統。楊航甚至還向中國軟件網透露,將來全部系統都要由誼品生鮮自研,包括財務軟件。

在雲時代,自研系統必須採用雲原生技術,這樣纔能有效解決傳統ERP等業務系統的架構不合理,同時又能研發徹底符合本身需求的系統。

03數據庫上雲、去Oracle


資深架構師都知道,保證業務系統可控的核心在於數據庫。

自研系統要絕對可控,數據庫用什麼呢?

你們的第一個共識是,不能再用Oracle。

緣由主要有兩個。一是Oracle在技術上不可控;二是Oracle成本過高,Oracle的雲數據庫版本也較少,與之對應的雲上運維與管理工具也比較少。

第二個共識是,數據庫要上雲,要用雲數據庫。權威市場研究機構Gartner指出,雲數據庫將是將來。到2021年,雲數據庫在整個數據庫市場中的佔比將首次達到50%;而到2023年,75%的數據庫要跑在雲平臺之上。

最核心的緣由是,傳統數據庫產品存在擴展速度慢、效率低等問題,根本沒法知足業務系統對實時性、穩定性、快速擴容的需求。

就像誼品生鮮因疫情而忽然在線交易量激增,日訂單量超過10萬單。本地部署的傳統數據庫很難應對這種爆發式的增加,實現彈性擴縮容。

但這是雲數據庫的強項。

雲原生數據庫每每採用利用分佈式共享存儲,而且存儲和計算分離、解耦,以方便在存儲和計算分別進行彈性擴容,作到極致的彈性。在彈性、高可用、負載均衡等方面,雲數據庫基本都是明顯優於本地部署的數據庫。

而且,雲數據庫能夠作到「按需按量使用,同時按需按量計費」。這對於互聯網企業而言極具吸引力。

若是用本地數據庫,要作到和雲數據庫同樣的高可用性,成本就會很是高。

對於誼品生鮮而言,因爲其服務器等硬件基礎設施已全面上雲。系統上雲、數據庫上雲也是一個必然趨勢。

最初誼品生鮮的業務系統採購自第三方廠商,而且部署在線下IDC機房內。一旦出了問題就只能等廠商的人來解決問題。

但如今,經過將所有業務遷移到阿里雲之上,而且深度使用雲數據庫,楊航帶領的基礎架構團隊才終於感受有了控制權。

04自治化與智能化


對於互聯網和電商企業而言,隨着自研系統的增多,數據庫運維與管理的挑戰將會愈來愈大。

對於誼品生鮮一樣如此。楊航下一步的解決方案是,誼品生鮮本身的技術運維團隊會更側重於內部運維效率平臺的研發,以此逐步減小DBA人員,下降運維成本、控制安全風險。

同時,DBA的傳統職能會被淡化掉,他們主要用於研發效率工具、自治服務工具,作更高價值的工做。自研系統迭代速度很是快,若是沒有數據庫的自治服務,不能實現自動化、智能化運維,還須要大量人工運維介入,會大大增長線上系統出故障的概率。

巧合的是,這也正是阿里雲數據庫自治服務DAS產品的發展目標。

DAS產品最先源於2014年的CloudDBA,是一個服務於內部的研發人員工具。2016年,阿里雲對它進行了升級和產品化,做爲雲服務推向了市場。從2017年開始阿里雲在其中加入自治功能,並利用阿里巴巴的場景和技術不斷驗證和完善,一直持續到2019年年末,正式改名爲DAS。

做爲阿里雲數據庫DAS產品線負責人,李廣望深有感觸,阿里雲數據庫自治服務DAS基於阿里巴巴自身數據庫規模化運維的專家經驗,結合人工智能和機器學習技術,已實現了自感知、自診斷、自修復和自安全的數據庫自動駕駛能力。

正是這個數據庫自治服務產品打動了楊航。

據楊航介紹,誼品生鮮的全部自研系統都基於雲服務,全部的雲服務都和阿里雲深度合做。

誼品生鮮選擇阿里雲的緣由有兩個。第一個是誼品生鮮已是阿里雲IaaS用戶。全部的硬件基礎設施都在阿里雲上,雲數據庫也能使用阿里雲是最好的選擇。

第二個緣由更爲重要。他們是看上了阿里雲在雲數據庫方面的生態完整性。

楊航認爲,數據庫運維與管理的便捷性、整體擁有成本是選擇哪一個廠商的雲數據庫時必需要考慮的重要因素。

對於互聯網公司或電商企業而言,他們不能在數據庫運維方面投入太多人員,不然成本過高,也特別容易出問題。

楊航團隊曾對國內市場上的數據庫運維與管理工具作過詳細比較,相對而言,阿里雲DAS具備比較明顯的優點。例如,其功能全面性比其餘國內廠商好,控制檯及帳單功能比國外廠商好。

而且在合做的過程當中,阿里雲數據庫對誼品反饋問題的處理效率很是高,而且產品質量很是有保障。誼品生鮮對阿里雲的服務支持很是滿意。

對於誼品生鮮這樣的電商企業來講,數據庫運維效率工具要能徹底地將運維團隊的工做流程和研發團隊的開發流程結合起來。也便是說,阿里雲DAS要和誼品生鮮內部效率平臺結合起來,賦能給研發人員。例如,雲上數據庫出現了告警,DAS將來要能把問題直接轉給相應的研發人員,從而提高效率。

按這種模式,之前他們處理一個故障平均須要10-20分鐘,要人肉排查故障,應用了阿里雲DAS以後,只需幾分鐘,問題就能獲得定位和解決,效率提高很是明顯。

正是藉助數據庫自治服務DAS,誼品生鮮自研系統的運維只須要幾我的就能搞定。經過上雲和深度使用雲數據庫,誼品生鮮整體數據庫使用成本下降了40%~50%。

在中國軟件網看來,誼品生鮮利用雲原生技術、採用雲數據庫自研系統的實踐意義還不只如此。它最重要的是爲同行們提供了在數字世界裏應對未知性、掌握可控性的一個方法。

想要get誼品生鮮同款「自動駕駛神器」?

點擊文字

當即體驗數據庫自治服務DAS

相關文章
相關標籤/搜索