低頻詞過濾

低頻詞過濾

題目描述:

請編寫程序,從包含大量單詞的文本中刪除出現次數最少的單詞。若是有多個單詞都出現最少的次數,則將這些單詞都刪除。

輸入數據:

程序讀入已被命名爲corpus.txt的一個大數據量的文本文件,該文件包含英文單詞和中文單詞,詞與詞之間以一個或多個 whitespace分隔。(爲便於調試,您可下載測試corpus.txt文件,實際運行時咱們會使用不一樣內容的輸入文件。)

輸出數據:

在標準輸出上打印刪除了corpus.txt中出現次數最少的單詞以後的文本(詞與詞保持原來的順序,仍以空格分隔)。

評分標準: 程序輸出結果必須正確,內存使用越少越好,程序的執行時間越快越好。
相關文章
相關標籤/搜索