201671010401包稚潼 實驗二 詞頻統計軟件項目報告

  • 需求分析

    (1)程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。
    (2)程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。
  • 可行性分析

    (1)操做可行性:系統的操做方式可否在用戶組織內行得通,詞頻統計所須要的資源有限。
    (2)經濟可行性:從經濟角度考慮,規劃方案的實現性和開發的價值,本次是一個做業,不存在經濟問題。
    (3)技術可行性:要考慮採用的硬件和軟件可否知足用戶需求。
  • 基本功能

    (1)指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數和柱狀圖。
    (2)高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。
    (3)統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。
  • 環境需求

    1.測試機環境:Windows環境
    2.JDK版本:jdk8u161
    3.JRE版本:jre8u161
  • 功能設計

    1.新建文本文件data.txt而且統計各個單詞出現的次數
    2.若是次數相同,安裝單詞的字典順序排序,輸出單詞個數
    3.輸入要查詢的單詞,顯示它出現的次數 ,用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。.統計該文本全部單詞數量及詞頻數
    4.輸出結果並將其存儲到result.txt文件中
  • 設計實現

    此軟件有兩個類:(1)WordCount.java主要實現文件的讀入和選擇對應的功能。根據用戶輸入的選擇調用對應的方法。
    (2)方法在Tongji.java中,oneWord(取一個單詞的頻率),gaopin(根據用戶輸入的k值取高頻詞),out(將單詞和詞頻數按字典順序輸入到result.txt文件)
    測試運行
  • 程序的運行截圖以下圖:
    • 單詞個數統計:
    • 詞頻統計:

代碼片斷

輸入英文文本

排序
java

  • 展現PSP

    任務內容 計劃共完成須要的時間(min) 實際完成須要的時間(min)
    計劃 10 9.5
    估計這個任務須要多少時間,並規劃大體工做步驟 16 20
    開發 200 230
    需求分析 (包括學習新技術) 12 10
    生成設計文檔 12 15
    設計複審 (和同事審覈設計文檔) 10 12
    代碼規範 (爲目前的開發制定合適的規範) 10 12
    具體設計 42 45
    具體編碼 120 130
    代碼複審 15 12
    測試(自我測試,修改代碼,提交修改) 30 40
    報告 15 15
    測試報告 6 6
    計算工做量 5 3
    過後總結 ,並提出過程改進計劃 6 4
    總結 本次項目對於java小白來講很是具備挑戰了,在同窗幫助下完成的不容易,大多數要求也未實現,在之後的學習中會更加努力的。編輯過程當中問題不少,須要繼續努力。
    源碼展現.
相關文章
相關標籤/搜索