ADF 第三篇:Integration runtime和 Linked Service

Azure Data Factory 系列博客:html

 

Integration runtime(IR) 是Azure 數據工廠在不一樣的網絡環境中進行數據集成的組件,用於幾個環境中:數據庫

  • Data Flow:在託管的Azure計算環境中執行Data Flow
  • Data movement:把存儲在公用網絡(public network)和私有網絡(on-premises或private network)之間複製數據
  • Activity dispatch:調度(dispatch)和監視在各類計算服務(例如 Azure Databricks、azure HDInsight、Azure 機器學習、Azure SQL 數據庫、SQL Server 等)上運行的轉換活動。
  • SSIS package execution:在託管的 Azure 計算環境中本機執行 SQL Server 集成服務 (SSIS) 包

在數據工廠中,活動(Activity)定義要執行的動做,Linked service 定義目標數據存儲,或計算服務。集成運行時(Integration runtime)提供了活動(Activity)和Linked Services之間的橋樑,它被連接服務或活動引用,提供一個計算環境,用於運行Activity,或者分派Activity,這使得ADF能夠在知足安全性和合規性需求的同時,以最高效的方式在最接近目標數據存儲或計算服務的區域中執行活動。安全

一,IR的類型

數據工廠提供了三種類型的IR,每種類型的IR 適用的網絡環境以下表所示:網絡

Azure IR的做用:機器學習

  • 能夠在Azure上執行Data Flow
  • 在cloud 數據存儲之間執行Copy Activity
  • 在public network上分派轉換活動(Transform Activity)

Self-hosted IR的做用:學習

  • 在雲數據存儲和私有網絡存儲之間執行Copy Activity
  • 對本地(on-premises)或Azure虛擬網絡種的計算資源執行轉換活動(Transform Activity)

若是想在私有網絡環境中執行數據集成,那麼能夠在on-premises環境(私有網絡環境)中安裝Self-hosted IR。spa

Azure-SSIS IR:orm

用於執行SSIS packages,經過把Azure-SSIS IR加入到on-premises的網絡中,數據工廠能夠用於本地數據訪問(on-premises data access)。htm

二,建立Self-Hosted IR

經過Azure Data Factory UI來建立, blog

選擇Self-Hosted 類型,選擇手動設置(Manual setup),

 點擊「Download and install integration runtime」,下載安裝包,並複製 authentication key,黏貼到"Register Integration Runtime (Self-hosted)" 頁面中:

 

 點擊頁面底部的「Register」 按鈕完成Self-Hosted IR的註冊。

三,Linked Service

鏈接服務(Linked services )相似於鏈接字符串,用於定義ADF鏈接到外部資源時所須要的鏈接信息,鏈接服務定義如何鏈接到外部數據源,而數據集表明外部源數據的結構。

而Linked Services 依賴於Integration runtimes,所以,咱們在建立Linked Service以前,須要建立Integration runtimes。

 

 

 

 

參考文檔:

Linked services in Azure Data Factory

Integration runtime in Azure Data Factory

相關文章
相關標籤/搜索