一個英文文本詞頻統計的軟件開發,其基本需求有:
1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。
2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。
3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數和柱狀圖。
4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數K,運行程序統計功能,可按文本中詞頻數降序顯示前K個單詞的詞頻及單詞。
5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt.git
基本功能:使用流的方法讀取文件,存儲讀取的單詞,記錄單詞的總數;可以讀取任意英文文本文件;具備統計單詞詞頻統計的功能。github
定義一個主函數main,用來實現讀取文件,存儲讀取的文件,記錄單詞的總數。
利用類treemap<K,V>基於樹的接口實現,其中,K爲鍵的類型,V爲映射值的類型。函數
經過本次實驗瞭解到了軟件開發的難度,尤爲是自身代碼基礎差對軟件開發影響巨大,使之花費了大量的時間去學習一些基礎東西,固然這方面也是在我從此的學習中 須要強化的。除此以外,此次實驗讓我切實體驗了軟件項目我的開發流程,掌握了在Github上發佈軟件項目的操做方法。
psp2.1 | 階段/時長 | 計劃總共須要完成的時間(min) | 實際完成須要的時間(min) |
Planning | 計劃 | 10 | 10 |
Estimate | 估計須要時間,並計劃大體工做步驟 | 10 | 15 |
Development | 開發 | 120 | 150 |
Analysis | 需求分析 | 10 | 15 |
Design Spec | 生成設計文檔 | 30 | 25 |
Design Review | 設計複審 | 5 | 5 |
Coding Standard | 代碼規範 | 6 | 6 |
Design | 具體設計 | 20 | 15 |
Coding | 具體編碼 | 80 | 100 |
Code Review | 代碼複審 | 15 | 10 |
Test | 測試 | 8 | 6 |
Reporting | 報告 | 5 | 3 |
Text Report | 測試報告 | 5 | 5 |
Size Measurement | 計算報告量 | 8 | 10 |
Postmortem&Process Improvement plan | 總結,並提出改進計劃 | 15 | 20 |