一、首先要實現單詞數量統計。 二、統計出每一個單詞出現的次數。 三、計算出每一個單詞出現的頻率。 四、統計結果進行可視化輸出。
基本功能: 一、實現單詞的詞頻統計 二、進行高頻詞彙統計 三、進行單詞數量查找 拓展功能: 條形圖顯示功能
測試機環境:windows環境 matlab版本:MATLAB R2015b
該設計實現過程是用MATLAB強大的數據計算與統計能力下實現的,經過定義參數,設置路徑實如今該設計界面引導下將任意英文文本文件讀入程序之中,而後進行根據空格鍵檢測判斷單詞,進而根據lower函數將全部單詞轉換成小寫,最後經過tabulate實現統計計算sortrows進行排序。設計界面由MATLAB所提供GUI界面實現。
詞頻統計: 生成單詞出現次數統計表
顯示單詞出現頻次統計圖
git
word=fileread('C:\Users\Administrator\Desktop\234.txt'); %讀入全文 word=regexprep(word,'\W',' '); %不是字符的,都轉換爲空格。主要是去除標點符號 word=lower(word); %變成小寫 words=regexp(word,' ','split')'; %根據空格分隔爲單詞cell %至此每一個單詞都拿出來了 rank = tabulate(words); %rank是三列向量,包括名稱,出現次數和百分比 ans=sortrows(rank,-2); %只根據第二列進行排序 -2表示降序 xlswrite('results',ans);%輸出爲excel文件
任務內容 | 計劃共完成須要的時間(min) | 實際完成須要的時間(min) |
計劃 | 15 | 10 |
估計這個任務須要多少時間,並規劃大體工做步驟 | 8 | 10 |
開發 | 180 | 230 |
需求分析 (包括學習新技術) | 15 | 15 |
生成設計文檔 | 10 | 15 |
設計複審 (和同事審覈設計文檔) | 8 | 12 |
代碼規範 (爲目前的開發制定合適的規範) | 10 | 9 |
具體設計 | 30 | 45 |
具體編碼 | 100 | 130 |
代碼複審 | 15 | 12 |
測試(自我測試,修改代碼,提交修改) | 10 | 12 |
報告 | 15 | 20 |
測試報告 | 15 | 16 |
計算工做量 | 5 | 5 |
過後總結 ,並提出過程改進計劃 | 15 | 15 |