Apache Falcon簡介-Hadoop數據生命週期管理框架

Apache Falcon是一個開源的hadoop數據生命週期管理框架, 它提供了數據源 (Feed) 的管理服務,如生命週期管理,備份,存檔到雲等,通過Web UI可以很容易地配置這些預定義的策略, 能夠大大簡化hadoop集羣的數據流管理. 本文主要介紹了Falcon的基本特性, 核心概念以及架構, 最後討論了它的優點和侷限. Hortonworks的hadoop發行版HDP中,數據治理包括F
相關文章
相關標籤/搜索