201671010457 朱石景 詞頻統計軟件項目報告

1、需求分析

一、首先要實現單詞數量統計。
          二、統計出每一個單詞出現的次數。 
          三、計算出每一個單詞出現的頻率。
          四、統計結果進行可視化輸出。

2、功能設計

基本功能:
           一、實現單詞的詞頻統計
           二、進行高頻詞彙統計
           三、進行單詞數量查找
          拓展功能:
            條形圖顯示功能

3、環境需求

測試機環境:windows環境
          matlab版本:MATLAB R2015b

4、設計實現

該設計實現過程是用MATLAB強大的數據計算與統計能力下實現的,經過定義參數,設置路徑實如今該設計界面引導下將任意英文文本文件讀入程序之中,而後進行根據空格鍵檢測判斷單詞,進而根據lower函數將全部單詞轉換成小寫,最後經過tabulate實現統計計算sortrows進行排序。設計界面由MATLAB所提供GUI界面實現。

5、測試結果

詞頻統計:
       生成單詞出現次數統計表


顯示單詞出現頻次統計圖
git

6、代碼片斷:、

word=fileread('C:\Users\Administrator\Desktop\234.txt'); %讀入全文
word=regexprep(word,'\W',' '); %不是字符的,都轉換爲空格。主要是去除標點符號
word=lower(word); %變成小寫
words=regexp(word,' ','split')'; %根據空格分隔爲單詞cell

%至此每一個單詞都拿出來了

rank = tabulate(words); %rank是三列向量,包括名稱,出現次數和百分比
ans=sortrows(rank,-2); %只根據第二列進行排序 -2表示降序
 
 xlswrite('results',ans);%輸出爲excel文件

7、展現PSP

任務內容 計劃共完成須要的時間(min) 實際完成須要的時間(min)
計劃 15 10
估計這個任務須要多少時間,並規劃大體工做步驟 8 10
開發 180 230
需求分析 (包括學習新技術) 15 15
生成設計文檔 10 15
設計複審 (和同事審覈設計文檔) 8 12
代碼規範 (爲目前的開發制定合適的規範) 10 9
具體設計 30 45
具體編碼 100 130
代碼複審 15 12
測試(自我測試,修改代碼,提交修改) 10 12
報告 15 20
測試報告 15 16
計算工做量 5 5
過後總結 ,並提出過程改進計劃 15 15

8、github源碼查看

https://github.com/zhushijing/save/uploadgithub

相關文章
相關標籤/搜索