Hadoop MapReduce編程 API入門系列之查找相同字母組成的字謎(三)

  找出相同單詞的所有單詞。現在,是拿取部分數據集(如下)來完成本項目。     項目需求   一本英文書籍包含成千上萬個單詞或者短語,現在我們需要在大量的單詞中,找出相同字母組成的所有anagrams(字謎)。   思路分析   基於以上需求,我們通過以下幾步完成:     1、在 Map 階段,對每個word(單詞)按字母進行排序生成sortedWord,然後輸出key/value鍵值對(so
相關文章
相關標籤/搜索