學習Hadoop第十四課(自定義分區Partitioner)

上一節課我們一起學習了Hadoop的遠程調試,這節課我們一起學習Hadoop的Partitioner(分區),首先說一下爲什麼要用到分區的功能,這裏我們舉個例子, 中國移動公司想要查看北京用戶的打電話情況,手機信號來自附近的基站,要查看北京用戶的信息得從全國所有的基站獲取信息並一一篩選,假如我們不把用戶按 省市進行分別存放的話,每次我們想查看某個省市的信息時便需要從全國所有的基站信息中去一一查詢,
相關文章
相關標籤/搜索