Azure 存儲簡介

Azure Storage Account(存儲帳戶)包含全部Azure Storage的數據對象,包括Blob、Data Lake Gen2,File、Queue、Disk和Table等服務,該Storage Account爲用戶的Azure Storage數據提供了惟一的命名空間,能夠經過HTTP或HTTPS來訪問它。Azure Storage Account中的數據是持久的、高度可用的、安全的和可擴展的。windows

一,存儲帳戶的類型

Azure Storage提供了4種類型的存儲帳戶,每種類型都支持不一樣的功能,並具備本身的訂價模型。瀏覽器

  • General-purpose v2 accounts:基礎的存儲帳戶,用於Blob、Data Lake Gen2,File、Queue和Table等服務,最經常使用和最基礎的存儲帳戶。
  • BlockBlobStorage accounts:具備高級性能特徵的bock blob和 append blob。推薦用於高事務處理率、數據較小且低存儲延遲的場景種。
  • FileStorage accounts:純文件的存儲帳戶
  • BlobStorage accounts:舊版的Blob-Only的存儲帳戶,推薦使用General-purpose v2 accounts。

存儲帳戶的做用是爲用戶在Azure中提供惟一的命名空間,存儲在Azure Storage中的任何對象都有惟一的地址,且都在惟一帳戶名下。帳戶名和Azure Storage Blog endpoint的組合構成了存儲帳戶中對象的基地址。安全

舉個例子,若是存儲帳戶的名稱是:mystorageaccount,默認的Blog storage的endpoint是:app

http://mystorageaccount.blob.core.windows.net分佈式

1,存儲帳戶的端點性能

存儲帳戶爲Azure中的數據提供了惟一的命名空間,使得存儲在Azure Storage中的每一個對象都有一個惟一的地址,該地址包含在存儲帳戶名,也就是說,存儲帳戶和Azure 存儲服務的端點的組合構成在存儲帳戶中對象的基地址:優化

2, Access tier(訪問層)spa

Azure Storage根據使用模式的不一樣,提供了用於訪問block blob數據的不一樣選項。Azure Storage中的訪問層(Access Tier)都針對特定的數據使用模式進行了優化,經過選擇合適的訪問層,能夠以最具成本效益的方式存儲Block Blob數據。.net

可用的訪問層:日誌

  • Hot:用於頻繁訪問存儲帳戶中的對象,在hot tier中,訪問數據最具備成本效益,而存儲數據的成本則較高。默認狀況下,在hot tier中建立新的存儲帳戶。
  • Cool:用於存儲不常常訪問,且存儲時間超過30天的大量數據。在Cool tier中存儲數據更具成本效益,而訪問數據的成本則較高。
  • Archive:僅用於單個Block Blob,歸檔層能夠忍受數小時的檢索延遲,而且數據在歸檔層中至少保留180天。歸檔層最適合存儲長時間訪問的數據,可是訪問數據是最慢的。

目前,只有 General-purpose V2 和 BlobStorage支持訪問層。

二,Blob存儲

Blob(Binary Large Object,二進制類型的大對象)存儲是Microsoft的雲對象存儲解決方案,Blob存儲通過優化,可存儲大量非結構化數據。 非結構化數據是不遵循特定數據模型或定義的數據,例如文本或二進制數據。

Blob存儲用於:

  • 把圖像或文檔直接提供給瀏覽器
  • 存儲文件以進行分佈式訪問
  • 流式傳輸視頻和音頻
  • 寫入日誌文件
  • 存儲數據以進行備份和歡迎
  • 存儲數據以on-premises方式進行分析,或Azure 託管服務。

1,Blob存儲的資源

Blob存儲提供三種資源:

  • 存儲帳戶
  • 存儲帳戶中的Container(容器)
  • 容器中的Blob

 

2,容器(Container)

一個容器組織了一組Blob,相似於文件系統中的目錄(Directory),一個Storage Account能夠包含無限數量的容器,一個容器能夠存儲無線數量的Blob。

3,Blob

Azure Storage支持三種的Blob:

  • Block blobs :用於存儲文本和二進制數據,塊Blob由能夠單獨管理的數據塊構成。
  • Append Blob:對追加操做進行優化的的Blob,特別適合用於記錄日誌。
  • Page blobs:存儲隨機訪問的文件,Page Blob存儲虛擬硬盤(Virtual Hard Drive,VHD)文件,並用做Azure VM的硬盤。

三,Azure Data Lake Storage Gen2存儲

Azure Data Lake Storage Gen2(簡稱二代Data Lake)是基於Azure Blob Storage構建的,具備Blob存儲的優勢,例如,低成本的分層存儲(tiered storage),高可用性,強一致性和災難恢復能力等。它也提供了有層次結構的文件系統(hierarchical file system)。二代Data Lake的核心功能是數據存儲和數據查詢兩個部分,它已經集成於存儲帳號(Storage Account)的功能體系之中。

Azure Data Lake Storage Gen2:有層次結構的文件系統

「層次結構」和「文件系統」是反覆被強調的Data Lake Storage Gen2的最大特色,也是它有別於傳統Blob對象存儲的最大不一樣。傳統對象存儲雖然從路徑上看起來也具備「目錄」的虛擬概念,但其實目錄一般並不實際存在,可認爲僅是Blob對象路徑字符串中的一部分,由於對象存儲本質上是key-value形式的存儲。而ADLS這樣的「文件系統」級別的存儲能力上,目錄則是一等公民,能夠設置訪問權限等元數據(而且可以被子節點繼承),也可使目錄重命名等操做變得十分便捷迅速。這樣的特性無疑使ADLS更適合做爲企業數據湖這樣應用的存儲介質。

Data Lake Storage Gen2能夠向Blob存儲中添加諷刺的名稱空間(hierarchical namespace),分層名稱空間把對象/文件組織到目錄的分層結構中,以實現高效的數據訪問,並使得文件的管理更加容易,經過目錄和子目錄來組織和操做文件。

在一般狀況下,對象存儲的命名約定是使用名稱中的斜槓來模仿分層目錄結構,好比C:/dir/file.txt,這種結構在Data Lake Storage Gen2中變爲現實。重命名或刪除目錄之類的操做將成爲目錄上的單個原子元數據操做。無需枚舉和處理共享目錄名稱前綴的全部對象。

在Data Lake Storage Gen2服務中,建立一個容器victest,在容器中建立Folder,或者在容器中存儲file:

四,一個服務,多個概念

因爲Data Lake Storage Gen2創建在Azure Blob存儲之上,所以多個概念能夠描述相同的共享事物。

如下是等效實體,卻使用不一樣的概念來描述, 除非另有說明,不然這些實體直接是同義詞:

 

 

參考文檔:

相關文章
相關標籤/搜索