Hadoop中的分區Partitioner???

參考 https://www.cnblogs.com/edisonchou/p/4297828.html Hadoop中分區,如果不指定的話,他會使用自帶的HashPartitioner 如果你業務中有需求,需要使用分區來查看文件的時候,就需要自己定義分區來使用 例如上圖,需要統計手機號碼的信息,就需要剔除電話號碼時??? 那你就需要自定義兩個分區? 這時候,結果就會分爲兩個文件。 也許這就是 分
相關文章
相關標籤/搜索