Gobblin簡介

     Gobblin是LinkedIn公司開發的用於在Hadoop環境裏統一數據抽取的框架。目前Gobblin可以建立多種pipelines,比如數據質量檢查器、源數據管理、開發和其他操作。      Gobblin支持多種類型的數據源。例如數據庫,Rest Api服務,FTP/SFTP,hdfs文件系統等,Gobblin對其中的數據抽取,轉換和加載,包括任務調度,任務分片,錯誤處理,任務狀態
相關文章
相關標籤/搜索