運行hadoop中出現的數據格式問題(for input string 異常.........(後面一串數字))

最近使用hadoop實現kmeans的時候數據格式老是不對,上網查了一下,網上大部分都說數字之間用空格隔開 上網查了一下,有說數字太大的,還有的說超出int範圍了,關於這類錯誤比較少,所以就總結一下。其實是每一行兩個數字之間的空白太多了,每一行兩個數字之間只有一個空格,我使用的kmeans jar包是mahout裏面的,如果查看kmeans源碼就知道每一行兩個數字之間只有一個空格。因此我使用正則表
相關文章
相關標籤/搜索