今年參加了 2019 雲棲大會 下一代雲存儲技術與最佳實踐專場,分享了 「對象存儲海量數據管理和應用最佳實踐」 議題,重點介紹對象存儲 OSS 的架構原理、數據管理、最佳實踐,現整理相關內容和你們探討。html
數據是企業的生命線,企業的數據存儲也廣泛面臨着 3 個挑戰:算法
經過大量的企業交流,從中總結了 5 個關鍵需求,以下圖所示:後端
OSS 實現上述業界領先的核心競爭力,並非一蹴而就,而是經過長期技術積累實現,以下是技術演進圖:緩存
OSS 隨着飛天操做系統發展而演進,它立項於 2008 年,和盤古一塊兒起航;開發完成後,先在阿里巴巴集團內打磨,2011 年正式在阿里雲商業化發佈。此後,每一年都在不斷髮布新功能、在更多可用區開服、知足客戶關鍵應用需求。
今年是 OSS 的大年,內核演進到第二代(OSS 2.0):安全
同時,今年發佈了 9 大新特性,以知足企業客戶的需求。服務器
首先,介紹最重要的 同城區域冗餘存儲 特性,以下圖所示:網絡
爲了提升可靠性和可用性,它實現了跨 Location 的糾刪碼技術,在任意一個 Location 故障後,數據依然可以訪問和存儲。經過對海量的開發運維數據分析,獲得最優的 Location 間距離、帶寬設計,防止 Location 發生故障、災難,避免出現數據丟失或者業務中斷。最終,實現了 12 個 9 的高可靠性,99.995% 的高可用性,而且在 標準、低頻存儲類型 均可以使用。架構
同時,2019 年至今發佈了以下新功能:併發
OSS 可以在巨大的數據體量下更新內核、併發布大量新特性,無疑就是飛行中更換飛機引擎,這須要優秀的架構來支撐,以下是 OSS 的架構原理圖:負載均衡
數據平面的核心:包含 盤古分佈式存儲 底座,有巢分佈式KV 構建的對象存儲元數據,對象存儲 後端服務;在此之上,就能夠經過 HTTP 服務端 和 網絡負載均衡 提供服務。
運維管控面的核心:主要是 赤驥 DEVOPS 平臺,它提供了CI/CD、灰度發佈/升級、下限維修、監控、日誌、運營大屏等豐富的功能。
該架構實現了 3 個亮點:
經過 十多年來穩定的架構設計,保證了系統的快速演進,結合智能開發運維平臺提升效率,實現人效是傳統開發、運維方式的 3~5 倍。
經過穩定的架構和功能開發,OSS 存儲了海量的數據,基於數據作智能分析、挖掘數據價值,將是存儲將來技術的重要趨勢。爲此,OSS 經過智能數據分析處理框架,有效卸載算法實現高效數據處理,以下圖所示:
核心思想是構建計算框架,並將它和存儲關聯。爲此,在對象存儲最近的位置,部署計算引擎,實現就近訪問(無需傳輸數據出 OSS 存儲系統,極大的下降網絡帶寬開銷)。而後,在對象存儲的數據路徑上和計算框架打通,實現關聯。爲了支持種類豐富的數據分析處理,設計了智能的調度框架,其特色是:
經過該框架,只須要認證卸載的算子,就能夠快速部署起來,並基於框架的集羣化調度能力快速服務化,並提供相似阿里雲服務的 SLA 能力。它的亮點是:下降帶寬開銷(近數據處理)、Serverless 體驗 (下降運維難度) 、簡單易用(基於 URL 使用方式),目前提供以下 4 類算法卸載:
經過技術架構原理介紹, 基本掌握了 OSS 相關功能,本節重點講解 OSS 的數據管理和最佳實踐。
但願上雲使用好對象存儲 OSS,先從遷移數據的管理開始;目前,OSS 遷移數據包括 2 大類方法:
閃電立方服務,包含以下子類:
在遷移數據時,要綜合考慮 容量、帶寬 選擇遷移方法,數據遷移後要對比數據的一致性、保證數據所有被遷移成功,同時要結合應用的 易用性 集成上述方法的 API 或者工具。
海量的數據須要作好組織,在數據空間管理上,建議先從以下 3 方面考慮:
海量的數據高效組織並存儲後,要在運行上保證業務連續性,建議從以下 4 個方向考慮:
基於OSS的架構、特性、數據管理建議,介紹 3 個近期最具表明意義的應用最佳實踐:
該方案的客戶有兩個主要測序中心,採用專線鏈接到阿里雲就近區域。本地 IDC 具有必定計算和存儲能力,用於處理部分業務,將處理數據歸檔到雲上,同時利用雲上的 K8S、批量計算、ECS 等作彈性大規模計算擴展。
它解決了 客戶 3 個痛點:專線網絡和 OSS 通訊、直傳數據,K8S & 批量計算 和 OSS 對接、直接計算,基於 OSS 的生命週期管理自動歸檔數據、下降成本。
在該方案中,雲端資源實時響應業務需求,支撐了業務快速迭代。快速使用阿里雲提供的新技術、新產品,享受技術紅利。CPFS 和 OSS 結合專爲訓練優化性能和成本,提高訓練速度,釋放GPU的算力,使得整個 AI 計算平臺效率更高。
該方案 體現了3個優點:彈性資源供給,大帶寬的吞吐能力,總體優化的 TCO。
此方案實現了視頻監控統一存儲,經過部署網關、監控接入平臺、混合雲存儲陣列,成功對接五家不一樣類型的攝像頭設備,無縫完成攝像頭對接遷移,實現雲上、雲下的統一平臺。該平臺可彈性承載 10000+ 設備接入,後續接入更多攝像頭時,可彈性擴展計算資源,而不影響原有業務。同時,本地混合雲存儲使用雲緩存技術,僅保存近期幾天的數據,而將海量的近百天視頻文件全量備份至雲端,徹底知足行業法規要求,並且還能夠利用 OSS 的智能數據處理功能進行視頻內容的分析。
該方案 知足了客戶 3 個典型需求:視頻監控統一存儲,數據高可靠、持久保存支撐行業法規,彈性資源按需供給、知足業務增加需求。
固然,OSS還有更多應用解決方案的最佳實踐,詳細信息請參考 相關鏈接。
構建業界領先的高可靠、高可用、易管理、安全合規的非結構化數據存儲平臺目標,是阿里雲對象存儲 OSS 不斷超越自個人驅動力,將來 OSS 將持續演進發展,知足企業數據存儲要求。
本文爲雲棲社區原創內容,未經容許不得轉載。