2017年12月31日,羅振宇在上海舉辦了《時間的朋友》跨年演講。node
這場四個小時的跨年演講吸引了近萬的現場觀衆和超過百萬的直播觀衆。數據庫
今天想和你們分享的是,在這場知識晚會的背後,獲得App、電商平臺技術人員和阿里雲團隊保駕護航的故事。後端
羅輯思惟&阿里雲服務器
羅輯思惟是著名的知識服務商和運營商,有微信公衆號、知識類音視頻節目、知識服務獲得App等產品。隨着品牌日積月累的沉澱,其跨年演講和其相關業務需求不斷增大。微信
羅輯思惟大量核心業務運行在阿里雲,目前團隊使用了ECS、CDN、OSS、多款雲數據庫、負載均衡、容器服務、全鏈路壓測PTS、Web應用防火牆、媒體轉碼、數據可視化等20多款產品。網絡
對於這次阿里雲護航,羅輯思惟的技術負責人沈仁奎表示:「很是感謝阿里傾囊相授雙11成功經驗,做爲產品的用戶很感動,大家服務很是貼切,完全融入到咱們團隊瞭解咱們的業務形態,給出不少有價值、切實際的建議,對咱們幫助很大。」架構
全鏈路壓測負載均衡
技術大考前的必備演習性能
全鏈路壓測是應戰業務大促不可缺乏的關鍵技術,這是阿里歷年備戰雙11的利器,在這次羅輯思惟備戰中它一樣被應用得淋漓盡致。測試
經過全鏈路壓測規劃跨年期間的系統容量,肯定基準吞吐量和擴容縮容策略,找到特定場景下集羣服務器配比和集羣的短板,對於壓測中發現的問題及時調整。
相比於經驗判斷和通常意義上的線上壓測,全鏈路壓測與業務場景更緊密相連,找到不一樣業務場景下的臨界峯值,計算出每一個業務應用的數量值,由點及線、由線及面從而得到總體狀況;經過性能測試服務PTS(Performance TestingService)編排全局業務場景和構造真實業務流量,達到讓業務和技術架構提早經歷業務洪峯的檢驗,確保跨年活動和平常核心服務的穩定性和健壯性。
羅輯思惟的全鏈路壓測接口愈200個,總體覆蓋率超過50%,囊括了其獲得APP和其獨立電商平臺的全部核心業務。
在不到三個月的時間內,羅輯思惟和阿里雲PTS團隊一共進行了大大小小愈七百次的單鏈路壓測、十六輪完整形態全鏈路壓測,壓測所耗費的資源至關於一百多萬用戶一同測試兩個多小時。
爲了避免影響到羅輯思惟用戶的體驗,其中一些全鏈路壓測都是在半夜和凌晨進行的。
因爲壓測範圍廣,其發現問題能力和提高效果也至關顯著。壓測前後總計發現數百問題,通過逐一排查,壓測目標的幾乎全部主要後端服務的業務系統都被優化改造。
舉例說明,在壓測中發現node側應用CPU飆升的瓶頸,經過接入阿里Node.js性能平臺,定位、分析異常並解決應用核心錯誤。通過技術人員們的不懈努力,系統吞吐能力提高上百倍。
ECS在手
資源呼風喚雨
在傳統的基於IDC搭建業務狀況下,必不可少的擔憂就是業務發展受制於固定且有限的資源。
若是資源儲備過多,那麼在平常平峯或流量低谷時,就會形成巨大的資源浪費;但是若是資源準備不充分,在流量高峯時,又影響到用戶體驗。
雲計算時代,彈性計算是首要優點。羅輯思惟選用了阿里雲ECS,該產品具有海量資源的彈性交付能力,能夠保證在一分鐘內建立出近1000臺雲服務器。
羅輯思惟平常狀況下按照必定比例選用包年月和按量的兩種服務器付費方式,在這次跨年演講中增大了按量計費的服務器用量,峯值時該種服務器達1000+臺,大大下降了計算資源成本和前期籌劃準備成本。
除去成本以外,更重要的是使用效果和體驗。從計算性能穩定性而言,一般狀況下,總體的ECS業務可靠性比線下物理機可靠性有大幅提高(99.95%業務可用性保證);若搭配高性能SSD雲盤,則至關於數據可靠性和業務可用性雙重保險,這也是羅輯思惟這次的選擇。
另外,ECS提供豐富的企業級實例,羅輯思惟選用了最新一代基於skylake處理器、25G網絡的企業級實例、大數據分析的D1型實例、高性能數據庫I2型實例等,在性能和成本上都很出色地知足了需求。