對象存儲技術架構剖析之三:Hitachi Content Platform(HCP)


剩蛋節快到了,我打算給你們送上性感的聖誕大餐,密集發佈我對各家對象存儲的技術架構剖析。後端


目前,我已經剖析了EMC和IBM它們對象的架構微信


對象存儲技術架構剖析之一:Dell EMC ECS
網絡

對象存儲技術架構剖析之二:IBM COS
架構


原本第三個廠商我想解讀NetApp的,但從投票的結果看,此次最佳對象存儲大部分網友竟然投給了Hitachi Vantara,不是EMC,也不是IBM,奇怪。
app



好吧,既然你們對HCP這麼感興趣,我今天就先來給你們分享HCP的技術架構。負載均衡


HCP其實表明Hitachi Content Platform,即日立的內容管理平臺。其實,最先的對象存儲叫CAS,即內容尋址存儲(Content-addressable storage)。所以,從HCP這個名字,就以爲HCP確定來源於早期的CAS。異步


恭喜你,猜對了。HCP來源於2003年的一個初創公司Archivas。工具



•Archivas 2003年在美國馬薩諸塞州成立,三輪風險投資中共募集了2800萬美金的資金性能

•Archivas的主打產品ArC(Archivas Cluster)軟件是一款內容尋址存儲(CAS,content addressed storage)產品。早期的Archivas在面臨EMC的Centera的競爭時,選擇了開放和低價的策略。spa

•2006年開始和HDS進行OEM合做,2007年被HDS收購,收購金額約1.2億美金


HCP目前最新版本是8.3,架構比較老。我聽原HDS的網友說原計劃進行代碼重構,19年會發布全新架構的9.0,但惋惜目前沒有看到。有知道內情的麻煩告訴你們一聲啥時候推出。





基於對象存儲HCP,還有三個衍生產品。HCP Anywhere至關於網盤,HCP Anywhere Edge是雲文件網關,HCI是智能數據挖掘平臺。本文只討論HCP。


HCP強調生態,和ISV的合做比較緊密。2018年,Hitachi Vantara宣傳在全球範圍內有4000多個集羣,有2000多家客戶,號稱目前在on-Prem對象存儲解決方案中排名第一(那個EMC估計表示不服,哈哈)。


HCP是作CAS起家,在金融機構合規方面有不少成功案例。由於其具備不少合規須要的特性。



咱們看到,相似Shredding(粉碎)這樣的特性,我在其餘對象存儲裏面沒有看到。還有,咱們看到,HCP竟然支持重刪,對象存儲原生支持重刪的,HCP也是主流對象裏面惟一一家。


HCP雖然支持純軟件,但通常會推薦一體機的部署模式。一體機有兩種節點,G節點和S節點。兩個類型的節點都是最多支持80個。



•G是訪問節點(單控,節點內本地盤RAID 6保護),最少須要四個。S節點是存儲高密節點(雙控,和G10採用以太網鏈接),節點內採用糾刪碼保護(20+6,chunk size=64MB),是可選的。

•G節點還支持FC SAN、NFS和公有云做爲後端存儲,所以,相似MinIO同樣,更像一個對象網關。

•元數據和索引保存在G10上,通常採用2副本,這樣才能支持G節點高可用。

•性能較高數據直接採用G10本地盤或者共享FC存儲,性能要求不高的通常採用S節點保存。

•採用共享SAN存儲和S節點保存數據的時候,數據能夠選擇1副本,G10經過多路徑進行HA,G節點故障能夠切換,S節點自己全冗餘的,所以也沒有單點故障


HCP也支持虛擬機(最多40個節點)和公有云部署(無節點限制)模式。on-prem部署原生支持SMB和NFS,任何一種協議寫入,其餘協議均可以讀取。


Hitachi Vantara最新發布了全閃存節點G10 All Flash。S節點都是雙全冗餘的。網絡全是萬兆接口。S節點也是最多能夠擴展到80個。


下面咱們來看看其軟件架構。


HCP的功能基本都在訪問節點實現,有多協議互訪、屬性反查、多租戶、多站點,跨站點EC、重刪、WROM等高級特性。咱們看到,搜索這塊HCP採用比較老的開源軟件Solr/Lucene,若是對象在寫入的時候進行搜索,性能很差。如今不少對象廠商通常都採用Elasticsearch,性能更好。


HCP宣傳其關鍵價值如上,我以爲不少其餘產品也有。



HCP每一個節點支持8-12.5億個索引,整個系統最多支持1000億對象,單對象最大5TB。從規格看,仍是蠻強大的。HCP產品的最新規格連接以下:

https://knowledge.hitachivantara.com/Documents/Storage/Content_Platform/8.3.x/Release_Notes/01_Content_Platform_v8.3.0_Release_Notes_-_Customer#Specifications



HCP因爲來自CAS,所以原生支持文件協議,支持POSIX語義。



上面是HCP的後臺服務,功能仍是很豐富的,特別是重刪,是其餘對象存儲幾乎看不到的。



HCP的多租戶功能畢竟完善,Gartner認爲這塊HCP是業界最佳水平。


HCP的多站點和EMC ECS不一樣,其原數據的複製也是異步的。可是,其能夠優先複製元數據。所以,數據不一致的時間比較短。還有,能夠只複製元數據,這樣數據能夠不出國,合規性更好。



HCP的跨站點EC(GEO-EC)最多支持6個站點,但只容許一個站點故障。



HCP的Geo-EC支持三種延遲糾刪的實現方式,用戶能夠根據須要選擇,知足不一樣場景的需求。


HCP採用兩層EC方案,雖然硬盤重構不用跨網絡,可是空間的利用率不如IBM。


咱們看到,IDC比較承認HCP,可是Gartner的承認度通常。



從Gartner在2019報告「Critical Capabilities for Object Storage」中的評價,咱們能夠看出幾個HCP的特色:

1.生態不錯,100個ISV,200個認證應用

2.部署困難、升級困難

3.產品更新慢,缺少深度監控工具

4.無多站點統一管理(有統一監控),管理界面難用



從打分看,Gartner給HCP的管理能力打了業界最低分。用過HCP的朋友都出來講一下,是否真的很難用啊?



場景得分中規中矩吧,可是離IBM仍是有很多距離的。


【小結】


總的來講,HCP雖然架構比較老,但歷史悠久,所以功能仍是比較豐富的。比較有特點的功能有

  • 重刪

  • 硬盤故障節點內重構

  • 多租戶

  • 跨站點EC

  • 桶異步複製

  • 分層上雲等


可是,對比其它的現代對象存儲架構,也有不足的地方,好比:


  • 在副本和EC的數據保護設置不靈活

  • 管理和擴容比較複雜

  • 沒有同步複製功能,沒法支持RPO=0的延展集羣

  • 沒有小文件歸併功能、沒有負載均衡功能

  • 沒有高性能HDFS專用客戶端等


最後,咱們仍是來繼續投票。微信的投票功能設計得很差,不能改投,但我懶得從新作一個投票了,就拿原來投票來用,沒有投票的繼續投票,已經投票的就不能再投了。




本文分享自微信公衆號 - 高端存儲知識(High-end_Storage)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索