學習的一個MapReduce程序(《beginner`s guide》中的例子)

第一個MR程序是實現關係型數據庫中經常都會遇到的表連接操作,也就是join。這裏是連接sales和accounts表,通過共同的ID列進行連接。同時統計出總的購買件數以及總的消費額。 下面是兩個示例數據,一個是sales.txt,另一個是accounts.txt。 首先是sales.txt: 001 35.99 2012-03-15 002 12.49 2004-07-02
相關文章
相關標籤/搜索