使用Flume-KafkaSource實時採集avro格式數據

業務描述:java 最近項目中須要實時採集業務數據庫CDC數據(這裏數據已被序列化爲avro格式數據),這裏技術架構咱們採用了Flume+Hdfs。數據庫 瞭解Flume的朋友都知道它的組件分爲三部分:source,channel,sink。具體原理部分這裏就再也不贅述,可查看官網或flume技術博客,這裏具體講一下實現流程及添坑之路。apache 業務過來的數據放在在kafka裏,因此sourc
相關文章
相關標籤/搜索