201673020127 詞頻統計軟件項目報告

需求分析

從給定文本中得出單詞頻數的統計數據。git

功能設計

首要功能是統計指定文本中的詞頻,保證其健壯性。在此基礎上還需實現顯示對指定單詞的統計結果,顯示指定數目高頻單詞的統計結果以及將統計結果輸出至結果文件等功能。github

設計實現

主程序使用無限循環以命令行方式進行交互。根據文字信息,可選擇需統計的文本,選定文本後,程序即對文本進行了詞頻統計,統計結果存放在鍵值類型爲「<String, Integer>」的映射中。以後,可選擇具體操做。具體操做有顯示對指定單詞的統計(W),顯示指定數目高頻單詞的統計結果(C)以及把統計結果輸出爲「result.txt」文件的功能(E)。編程

  • 「W」操做先查找映射中對應數據,根據數據計算需打印的符號數,符號數按單詞詞頻與詞頻總數比縮小限制在50個之內,隨後打印成柱狀圖。
  • 「C」操做因用戶每每查詢的數量較單詞總量少而使用選擇排序。
  • 「E」操做則先排序映射的關鍵字集,再照順序輸出至目標文件。

另有必定的防止不合法輸入的設計提升程序的健壯性。模塊化

測試運行

使用《老人與海》做爲測試用例。



測試

總結

在設計過程當中因編程習慣未能很好地作到模塊化設計,在之後的設計中應把不一樣功能的代碼加以區分。編碼

PSP

PSP各個階段 計劃時間(min) 實際時間(min)
計劃 5 10
開發 35 35
需求分析 5 5
生成設計文檔 0 0
設計複審 0 0
代碼規範 0 0
具體設計 5 5
具體編碼 20 20
代碼複審 5 5
測試 5 5
報告 10 10
測試報告 0 0
計算工做量 5 5
過後總結,並提出改進計劃 5 5
總共花費的時間 50 55

GitHub

相關文章
相關標籤/搜索