201671010424馬玉琴實驗二詞頻統計軟件項目

1、需求分析
1.設計一個詞頻統計小軟件,對給定的英文文章進行單詞頻率的統計。
2.文章中相應的標點不計入統計。
3.將統計結果以從大到小的排序方式輸出。
2、功能設計
1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。
2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。
3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數。
4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。
5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。
3、設計實現
1.讀入哈利波特這個文檔
2.用戶輸入想要查找的一個或者人一個英文單詞,可出現該詞在文中出現的頻數
3.程序具備統計功能,能夠按照文本中詞頻數降序顯示詞頻以及單詞
4.程序能夠輸出到文件中。
4、源代碼地址:https://github.com/styleab/demo
5、測試運行


git

6、實驗總結
由於是跨專業以前沒有學習過計算機編程,獨立完成這個做業很困難,並且此次時間很短只能完成老師佈置的部份內容。老師把做業佈置下來我從網上找了一些參考示例和資料,通過比較做業完成時間較短,在做業規定胡提交時間很難所有學會,並且沒有編程基礎,只能捉摸着寫出一點點的代碼,以及向同窗請教完成一部分。之後要利用空閒時間學習編程。
7、PSP
github

相關文章
相關標籤/搜索