Java的String不能處理中文utf-8編碼

Sequence File 文件格式支持文件分割,因此適合map-reduce做業。最近有一個項目,把kafka的protobuf數據寫到hdfs,方便下游的離線做業作數據分析。java 在kafka中,protobuf序列化成了byte數組(message就是byte數組)。這個時候在linkedin的camus(linkedin開源的一個把kafka數據寫到hdfs 的工具)中配置做業把kaf
相關文章
相關標籤/搜索