201671030108 +詞頻統計軟件項目報告

#任務一: ##需求分析java

  • 使用JAVA編程語言,獨立完成一個英文文本詞頻統計的軟件開發。軟件基本功能要求以下: 1.程序可讀入任意英文文本文件,該文件中英文詞數大於等於1個。 2.程序須要很壯健,能讀取容納英文原版《哈利波特》10萬詞以上的文章。 3.指定單詞詞頻統計功能:用戶可輸入從該文本中想要查找詞頻的一個或任意多個英文單詞,運行程序的統計功能可顯示對應單詞在文本中出現的次數和柱狀圖。 4.高頻詞統計功能:用戶從鍵盤輸入高頻詞輸出的個數k,運行程序統計功能,可按文本中詞頻數降序顯示前k個單詞的詞頻及單詞。 5.統計該文本全部單詞數量及詞頻數,並能將單詞及詞頻數按字典順序輸出到文件result.txt 。 根據實驗要求得出以下功能需求: 1.指定單詞詞頻統計功能 2.高頻詞統計功能 3.統計該文本全部單詞數量及詞頻數

##功能設計git

  • 根據實驗要求分爲基本功能和擴展功能以下: 1.基本功能(3項):指定單詞詞頻統計功能、高頻詞統計功能、統計該文本全部單詞數量及詞頻數按字典順序輸出的功能同時生成result.txt文件。 2.擴展功能(1項):將詞頻數降序排列的功能。

##設計實現github

  • 設計了主類Main.java,接口類CountDao.java,接口實現類Count.java。 主類功能是顯示功能選項,進行功能接口調用;接口類功能是調用接口實現類即調用具體功能;接口實現類主要用來編寫具體實現功能。 設計實現流程圖以下: ##測試運行編程

  • 本次設計一共實現了4項功能,測試結果以下圖所示: 圖一 圖二 圖三 圖四 #優秀代碼展現數組

  • 統計文本文件中的單詞個數編程語言

    //經過鍵值對的方式去分別存儲單詞和出現的次數
       //Map<String, Integer> map = new TreeMap<String, Integer>();
       //建立一個words數組,將split分割的字符串存入數組
       String[] words = s.split("[【】、.。,\"!--;:?\'\\] ]");
       for (int i = 0; i < words.length; i++) {
       	String key = words[i].toLowerCase();//將全部單詞轉化爲小寫
           if (key.length() > 0) {
           	//用containsKey判斷map集合對象中是否包含某個字符串
               if (!map.containsKey(key)) {//若是不包括說明第一次出現,則給頻率值賦1;
               	map.put(key, 1);
               	} else {// 若是不是第一次出現,就把value值++,那麼value值是多少就是出現了幾回
               		int value = map.get(key);//用get(key)獲取對應的value值
               		value++;
               		map.put(key, value);
               		}
               }
           }
  • 按照指定單詞查詢出現次數ide

System.out.print("請輸入想查詢的單詞:");
        Scanner scan1 = new Scanner(System.in);
        String word = scan1.nextLine();
        //判斷是否存在所要查詢的單詞
        boolean b = map.containsKey(word);
        if(b){
        	//根據key單詞查找次數value
        	for (Map.Entry<String, Integer> m :map.entrySet())  {

        		if (m.getKey().equals(word)) {
        		int v = m.getValue();
        		System.out.println(v);
        		}}
        }else {
			System.out.println("此單詞不存在!");
		}
  • value按照降序排列輸出map
//按照value降序排列map
         List<Map.Entry<String, Integer>> nlist = new LinkedList<Map.Entry<String, Integer>>(map.entrySet());
         Collections.sort(nlist, new Comparator<Map.Entry<String, Integer>>()
         {
             @Override
             public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2)
             {
                 int compare = (o1.getValue()).compareTo(o2.getValue());
                 return -compare;
             }
         });

         Map<String, Integer> result = new LinkedHashMap<String, Integer>();
         for (Map.Entry<String, Integer> entry : nlist) {
             result.put(entry.getKey(), entry.getValue());
         }
         
         for (String a : result.keySet()) {
         	System.out.println( a + "-----" + result.get(a));
         	}
  • 對key按照字典順序輸出map
//利用TreeMap實現Comparator接口
        Comparator<Map.Entry<String, Integer>> valueComparator = new Comparator<Map.Entry<String,Integer>>() {
        	public int compare(Map.Entry<String, Integer> o1,Map.Entry<String, Integer> o2) { 
        		return o1.getKey().compareTo(o2.getKey());//降序排序
       		}
        }; 
        //map轉換成list進行排序,Entry是Map中的一個靜態內部類,用來表示Map中的每一個鍵值對
        //map.EntrySet(),實現了Set接口,裏面存放的是鍵值對.
        List<Map.Entry<String, Integer>> list = new ArrayList<Map.Entry<String,Integer>>(map.entrySet()); 
        // 排序
        Collections.sort(list,valueComparator); 
        System.out.println("已生成result.txt文件");
        System.out.println("-----------------全部單詞按字典順序排序以下---------------");
      	for (Map.Entry<String, Integer> entry : list) { 
      		System.out.println(entry.getKey() + "----" + entry.getValue());
       		bufferedWriter.write(entry.getKey()+"----"+entry.getValue()+"\r\n");
       		}

#總結模塊化

  • 在設計的過程當中主要遵循「低耦合高內聚」的模塊化原則,本人在實驗中設計一個Main主類的基礎上經過接口調用接口實現類來實現其餘各個功能,以達到實驗要求同時便於分而治之的編寫須要實現的4個功能。

#任務二:學習

  • 將包含任務1源碼的完整工程文件提交到已註冊的Github帳號下的項目倉庫中 個人本次設計代碼你能夠在源碼完整查看 #任務三: ##本次設計的PSP #總結
  • 此次設計在剛剛開始的設計部分花了不少的時間,主要是不知道從哪兒下手,並且本身的編程功底也不是很好,因此在完成這次設計的時候花費了不少的時間,也找了不少的資料來進一步瞭解JAVA語言的使用。可是此次設計也沒有很完整,沒有實現柱狀圖的功能,對於不熟悉和未實現的功能我會在之後的學習中更加努力的補回來。
相關文章
相關標籤/搜索