201671010443 徐明錦 詞頻統計軟件項目報告

1、需求分析

1.設計一個詞頻統計小軟件,對給定的英文文章進行單詞頻率的統計。
2.文章中相應的標點不計入統計。
3.將統計結果以從大到小的排序方式輸出。java

2、功能設計

1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。
2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。
3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數。
4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。
5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。c++

3、設計實現

1.由於是跨專業0.0···並不會c++和java,只能用僅學過的C語言進行編寫,仍是挺費勁的。
2.定義一個包含單詞和頻率兩個成員的結構體來統計詞頻。
3.使用fopen函數讀取指定的文檔。
4.使用fgetc函數獲取字符,再根據取得的字符是不是字母進行不一樣的處理。
5.採用冒泡排序法對統計結果進行排序。
5.將整個統計結果循環輸出。git

4、源代碼地址:連接

5、測試運行

部分代碼:

運行結果:
github

6、總結

本次實驗內容有點複雜,完成過程十分艱辛。但同時也認識到自身編程能力的不足,同時經過此次實踐很好的鍛鍊了咱們解決問題的能力,使咱們受益不淺。編程

7、展現PSP

PSP2.1 任務內容 計劃共完成須要的時間(min) 實際完成須要的時間(min)
Planning 計劃 30 35
Estimate 估計這個任務須要多少時間,並規劃大體工做步驟 30 40
Development 開發 200 300
Analysis 需求分析 (包括學習新技術) 80 100
Design Spec 生成設計文檔 45 45
Design Review 設計複審 (和同事審覈設計文檔) 20 25
Coding Standard 代碼規範 (爲目前的開發制定合適的規範) 30 35
Design 具體設計 50 60
Coding 具體編碼 200 300
Code Review 代碼複審 60 80
Test 測試(自我測試,修改代碼,提交修改) 60 100
Reporting 報告 55 80
Test Report 測試報告 20 30
Size Measurement 計算工做量 10 10
Postmortem & Process Improvement Plan 過後總結 ,並提出過程改進計劃 25 60
相關文章
相關標籤/搜索