Hive項目實戰二

1.數據清洗java   1)數據分析apache 在video.txt中,視頻能夠有多個所屬分類,每一個所屬分類用&符號分割,而且分割的兩邊有空格字符,多個相關視頻又用「\t」進行分割。爲了分析數據時方便對存在多個子元素的數據進行操做,咱們首先進行數據重組清洗操做。app 具體作法:將全部的類別用「&」分割,同時去掉兩邊空格,多個相關視頻 id 也使用「&」進行分割,這裏看起來將"&"換成"\t
相關文章
相關標籤/搜索