201671010448 詞頻統計軟件項目報告

實驗二 詞頻統計軟件項目報告

需求分析

  • 使用JAVA編程語言實現如下基本功能
  • 1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。
  • 2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。
  • 3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數和柱狀圖。
  • 4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。
  • 5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。java

    功能設計

    基本功能:

  • 用戶可輸入任意英文文本
  • 容量10萬詞以上
  • 運行程序的統計功能可顯示對應單詞在文本中出現的次數和柱狀圖git

    擴展功能:

  • 高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。
  • 統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt。github

    設計實現

  • 主程序使用循環體將讀入的文章進行讀取
  • 此外用 String[] wordsArr1 = readLine.split("[^a-zA-Z]"); 過濾出文章中的字母,併除去長度爲0的行
  • 用 String[] wordsArr1 = readLine.split("[^a-zA-Z]"); 方法存儲單詞的計數信息
  • 最後實現降序排列編程

    測試運行

  • 運行結果如圖所示:網絡

代碼片斷

  • 輸入英文文本
  • 過濾出字母

  • 進行排序

總結:

  • 這次試驗由於對語言的學習不夠,程序借鑑網絡,對程序進行了研讀和理解。存在的不少不足在之後的學習中,補充本身在語言方面的不足,課餘時間補充java,c等基本語言。編程語言

    PSP展現:

    PSP2.1 任務內容 計劃共完成須要的時間(min) 實際完成須要的時間(min)
    Planning 計劃 10 8
    Estimate 估計這個任務須要多少時間,並規劃大體工做步驟 60 40
    Development 開發 10 10
    Analysis 需求分析 (包括學習新技術) 6 5
    Design Spec 生成設計文檔 20 15
    Design Review 設計複審 (和同窗一塊兒審覈設計文檔) 6 6
    Coding Standard 代碼規範 (爲目前的開發制定合適的規範) 20 20
    Design 具體設計 20 30
    Coding 具體編碼 10 8
    Code Review 代碼複審 5 5
    Test 測試(自我測試,修改代碼,提交修改) 5 5
    Reporting 報告15 12
    Test Report 測試報告 8 8
    Size Measurement 計算工做量 8 6
    Postmortem & Process Improvement Plan 過後總結 ,並提出過程改進計劃 10 10

    源碼查看

  • 點擊連接:(https://github.com/healer-devil/yuandaima/blob/master/src/danci.java)學習

相關文章
相關標籤/搜索