201671030104 鄧海祥-詞頻統計軟件項目 相信本身html
從給定文本中得出單詞頻數的統計數據,對以前的設計進行優化。git
以以前的設計爲原型。爲使設計更加用戶友好,設計了圖形用戶界面。柱狀圖改成使用繪圖的方式呈現。爲使得統計結果更具備針對性的信息價值,對統計過程進行了修改。初時收集了冠詞、代詞與介詞以過濾統計結果,調試後感受效果不理想,改成直接使用English Stop Words (CSV)。二詞詞組的統計依賴於對輸入文本單詞的順序檢查,把連續兩個符合保留條件的單詞拼接成「P S」一個字符串放入映射統計下來,其中P與S爲先後的兩個單詞。github
while ((temp = br.readLine()) != null) { String t[] = temp.split(" "); String p = ""; for (String s : t) { while (true) { if (s.length() == 0) { break; } else { if (s.charAt(0) < 'A' || (s.charAt(0) > 'Z' && s.charAt(0) < 'a') || s.charAt(0) > 'z') { s = s.substring(1); } else { break; } } } if (s.length() > 0 && !DS.SW.contains(s.toLowerCase())) { tSP.cN += s.length(); if (DS.wm.containsKey(s)) { DS.wm.put(s, DS.wm.get(s) + 1); } else { DS.wm.put(s, 1); } if (p.length() > 0 && !DS.SW.contains(p.toLowerCase())) { String ts = p + " " + s; if (DS.pm.containsKey(ts)) { DS.pm.put(ts, DS.pm.get(ts) + 1); } else { DS.pm.put(ts, 1); } } } p = s; } tSP.rN++; }
以《老人與海》爲例。
測試
PSP各個階段 | 計劃時間(min) | 實際時間(min) |
---|---|---|
計劃 | 10 | 10 |
開發 | 365 | 355 |
需求分析 | 10 | 10 |
生成設計文檔 | 0 | 0 |
設計複審 | 5 | 5 |
代碼規範 | 5 | 5 |
具體設計 | 10 | 15 |
具體編碼 | 270 | 270 |
代碼複審 | 5 | 5 |
測試 | 60 | 45 |
報告 | 10 | 10 |
測試報告 | 0 | 0 |
計算工做量 | 5 | 5 |
過後總結,並提出改進計劃 | 5 | 5 |
總共花費的時間 | 385 | 375 |
團隊的合理規劃與分工能夠更好地完成具備必定規模的軟件設計。本次設計基本能夠知足要求,但也有許多能夠改進的細節。優化