201671030129 詞頻統計項目報告

(一)需求分析

1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。git

2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。github

3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數和柱狀圖。編程

4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。模塊化

5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。學習

(二)功能設計

1.程序讀入文件,則須要程序有讀入文本數據的功能;測試

2.高頻詞統計功能和指定單詞詞頻統計功能須要程序有比較和排序功能。編碼

3.單詞及詞頻數按字典順序輸出到文件result.txt,須要程序具備向文本輸出數據的功能。設計

(三)設計實現

(四)測試運行

  • 輸入文件名,彈出查詢選項;

  • 功能一,鍵入查詢的單詞,顯示單詞在文章中出現的次數;

  • 功能二,鍵入想要查看的第一個到第n個單詞的頻度,並顯示柱狀圖;

  • 功能三,將單詞按照a-z的順序寫入到result.txt文件中;

(五)部分代碼

  • 該段代碼實現了用戶查詢單詞的頻率統計。

(六)總結

本次項目的完不一樣於之前學習中其餘的項目的完成,在本次項目的開始,進行了需求分析,明確需求,爲後續工做節省了一部分時間,可是因爲本身對Java的掌握度不夠,致使在編碼過程當中浪費了不少時間。本次詞頻統計分爲main和workcount兩個類,模塊化編程,在每個小的模塊出來之後,進行檢測,節省了部分時間。blog

(七)psp

點擊此處查看源代碼排序

相關文章
相關標籤/搜索