經常使用的數據集成ETL工具備哪些?

  經常使用的數據集成ETL工具備哪些?ETL工具用於將異構數據轉換爲同類數據,而後由數據科學家用於從數據中得到有價值的數據,經常使用的ETL工具備Microsoft-SQL Server集成服務、AWS Glue、Apache NiFi、Informatica PowerCenter、IBM的Infosphere Information Server等。數據庫

  ETL工具是什麼呢?ETL是英文Extract-Transform-Load的縮寫,用來描述將數據歷來源端通過抽取、轉換、加載至目的端的過程。ETL一詞較經常使用在數據倉庫,但其對象並不限於數據倉庫。數據集成ETL工具:服務器

  一、Microsoft-SQL Server集成服務(SSIS)架構

  爲了構建高性能的數據集成解決方案,例如提取,轉換等,SSIS被認爲是一個出色的平臺。由用於構建和調試程序包的圖形工具和嚮導,用於執行工做流程功能(包括執行SQL語句,FTP操做等)的任務組成。工具

  SSIS的功能:數據集成和工做流應用程,用於ETL的數據倉庫工具。性能

  二、AWS Glueui

  AWS Glue是一種簡單且具備成本效益的,徹底託管的無服務器ETL,用於對數據進行分類並將其跨多個數據源移動。由AWS Glue數據目錄(即中央元數據存儲庫,ETL引擎和靈活的計劃)組成。url

  AWS Glue的功能:它生成ETL腳本以將數據從源轉換爲目標,檢測架構更改並適應您的首選項。spa

  三、Apache NiFi.net

  Apache NiFi支持轉換,數據路由和系統中介邏輯的可擴展且功能強大的有向圖。開發它是爲了使系統之間的數據流自動化。流控制器,Web服務器,內容存儲庫,擴展是Java虛擬機上NiFi的某些組件。設計

  Apache NiFi的功能:高度可配置,基於Web的用戶界面。

  四、Informatica PowerCenter

  Informatica PowerCenter是一個數據集成平臺,可幫助加快數據集成項目並迅速將數據交付業務。

  Informatica PowerCenter的功能:用於分析和應用程序的實時數據,可擴展性和零停機時間。

  五、IBM的Infosphere Information Server

  IBM Infosphere Information Server是一個提供大量並行功能的平臺。此外,它提供了一個高度靈活且可擴展的平臺,能夠處理全部數據量,是一個平臺,容許用戶清理,監視,理解和轉換數據。

  Infosphere Information Server的功能:跨各類系統鏈接數據,評估、分析和監視數據質量。

  六、 Qlik Replicate

  Qlik Replicate是一個數據集成平臺,支持多種用例,其中包括實時數據倉庫,大型機現代化該平臺可自動執行復制過程,其中包括跨全部主要數據庫,數據倉庫等生成目標架構。

  Qlik Replicate的功能:數據保護,高性能,實時更新,直觀的GUI,可複製數據攝取和複製

  七、Oracle Data Integrator

  Oracle Data Integrator是一個平臺,可知足從高性能批處理裝載到啓用SOA的數據服務等幾乎全部類型的數據集成需求。包括與Oracle Warehouse Builder到Oracle Data Integrator的互操做性。

  Oracle Data Integrator的功能:快速的開發和維護,數據質量防火牆。

  八、SAP BusinessObjects數據集成器

  藉助SAP BusinessObjects Data Integrator,組織能夠在分析環境中提取,轉換,集成和加載數據。組織能夠從幾乎任何來源提取數據,進行轉換並將其集成到任何目標數據庫中。

  SAP的功能:先進的調試功能,數據質量功能。

  九、SAS-數據集成工做室

  SAS用於構建,實施和管理數據集成過程,而與平臺,應用程序和數據源無關,是一個功能強大的設計工具。該工做室易於管理,具備多用戶環境,能夠在大型項目上進行協做。

  SAS功能:提供標準轉換庫,使您能夠查詢和使用跨多個系統的數據。鄭州不孕不育醫院https://jbk.39.net/yiyuanzaixian/zztjyy/

相關文章
相關標籤/搜索