1.設計一個詞頻統計小軟件,對給定的英文文章進行單詞頻率的統計。
2.文章中相應的標點不計入統計。
3.將統計結果以從大到小的排序方式輸出。java
1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。
2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。
3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數。
4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。
5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。c++
1.由於是跨專業0.0···並不會c++和java,只能用僅學過的C語言進行編寫,仍是挺費勁的。
2.定義一個包含單詞和頻率兩個成員的結構體來統計詞頻。
3.使用fopen函數讀取指定的文檔。
4.使用fgetc函數獲取字符,再根據取得的字符是不是字母進行不一樣的處理。
5.採用冒泡排序法對統計結果進行排序。
5.將整個統計結果循環輸出。git
部分代碼:
運行結果:
github
本次實驗內容有點複雜,完成過程十分艱辛。但同時也認識到自身編程能力的不足,同時經過此次實踐很好的鍛鍊了咱們解決問題的能力,使咱們受益不淺。編程
PSP2.1 | 任務內容 | 計劃共完成須要的時間(min) | 實際完成須要的時間(min) |
---|---|---|---|
Planning | 計劃 | 30 | 35 |
Estimate | 估計這個任務須要多少時間,並規劃大體工做步驟 | 30 | 40 |
Development | 開發 | 200 | 300 |
Analysis | 需求分析 (包括學習新技術) | 80 | 100 |
Design Spec | 生成設計文檔 | 45 | 45 |
Design Review | 設計複審 (和同事審覈設計文檔) | 20 | 25 |
Coding Standard | 代碼規範 (爲目前的開發制定合適的規範) | 30 | 35 |
Design | 具體設計 | 50 | 60 |
Coding | 具體編碼 | 200 | 300 |
Code Review | 代碼複審 | 60 | 80 |
Test | 測試(自我測試,修改代碼,提交修改) | 60 | 100 |
Reporting | 報告 | 55 | 80 |
Test Report | 測試報告 | 20 | 30 |
Size Measurement | 計算工做量 | 10 | 10 |
Postmortem & Process Improvement Plan | 過後總結 ,並提出過程改進計劃 | 25 | 60 |