「1000萬字符串,去掉重複」的一些思考和java實現

題目:1000萬字符串,其中有些是重複的,須要把重複的所有去掉,保留沒有重複的字符串。請怎麼設計和實現? java 大數據的字符串處理我通常想到了trie樹和hashmap,jdk裏有hashmap的實現,因此想先用hashmap來試試效果,在用hashmap來測試前先編個小代碼,用來生成1000萬的字符串,使用隨機函數來選擇字符:node //生成sum個單詞,並輸入到word.txt文件中去。
相關文章
相關標籤/搜索