201671010443 徐明錦 詞頻統計軟件項目報告

###1、需求分析 1.設計一個詞頻統計小軟件,對給定的英文文章進行單詞頻率的統計。 2.文章中相應的標點不計入統計。 3.將統計結果以從大到小的排序方式輸出。 ###2、功能設計 1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。 2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。 3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數。 4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。 5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。 ###3、設計實現 1.由於是跨專業0.0···並不會c++和java,只能用僅學過的C語言進行編寫,仍是挺費勁的。 2.定義一個包含單詞和頻率兩個成員的結構體來統計詞頻。 3.使用fopen函數讀取指定的文檔。 4.使用fgetc函數獲取字符,再根據取得的字符是不是字母進行不一樣的處理。 5.採用冒泡排序法對統計結果進行排序。 5.將整個統計結果循環輸出。 ###4、源代碼地址:連接 ###5、測試運行 部分代碼: 運行結果: java

###6、總結 本次實驗內容有點複雜,完成過程十分艱辛。但同時也認識到自身編程能力的不足,同時經過此次實踐很好的鍛鍊了咱們解決問題的能力,使咱們受益不淺。 ###7、展現PSP | PSP2.1 | 任務內容 | 計劃共完成須要的時間(min) | 實際完成須要的時間(min) | | ------ | ------ | ------ | ------ | | Planning | 計劃 | 30 |35 | Estimate | 估計這個任務須要多少時間,並規劃大體工做步驟 | 30 |40 | Development | 開發 | 200 |300 | Analysis | 需求分析 (包括學習新技術) | 80 |100 | Design Spec | 生成設計文檔 | 45 |45 | Design Review | 設計複審 (和同事審覈設計文檔) | 20 |25 | Coding Standard | 代碼規範 (爲目前的開發制定合適的規範) | 30 |35 | Design | 具體設計 | 50 |60 | Coding | 具體編碼 | 200|300 | Code Review | 代碼複審 | 60 |80 | Test | 測試(自我測試,修改代碼,提交修改) | 60 |100 | Reporting | 報告 | 55 |80 | Test Report | 測試報告 | 20|30 | Size Measurement | 計算工做量 | 10 |10 | Postmortem & Process Improvement Plan | 過後總結 ,並提出過程改進計劃 | 25 |60c++

相關文章
相關標籤/搜索