做業連接測試
做業要求中已有的內容將再也不回答,在博客或羣中已解答的問題將再也不回答。優化
- Java 版本要求
- Java 對包管理器的支持狀況,是否容許使用Maven / Gradle等
- 不支持包管理器,但在符合組織目錄要求的狀況下容許引用第三方庫,必須可編譯,如按包路徑複製class文件等
- C++ 編譯參數,包括但不限因而否開啓編譯優化、使用字符集、target msvcrt等
- 使用VS的自帶腳本vcvarsall.bat進行編譯
- C++ 對包管理器的支持狀況,是否容許使用NuGet / vcpkg等
- 不支持包管理器,但在符合組織目錄要求的狀況下容許引用第三方庫,必須可編譯,如直接複製源代碼等
- 輸出格式換行符選用格式,\r\n或\n
- 空白字符的定義
- ASCII中的33個控制字符和空格(0-3二、127)
- 換行符字符數如何計算
- 爬蟲測試要求
- 爬蟲部分不與wordcount一塊兒測試,可自由發揮,具體請看做業要求
- 尾行輸出要求
- 輸出格式修正
- 基本需求和進階需求中的詞頻統計的輸出中,格式應爲"<word word>",單詞或詞組與尖括號間無空格
- 進階需求測試數據
- 進階需求的測試數據就是cvpr2018的論文列表爬取結果。
- 幾個合法單詞中夾雜着不合法單詞,如何斷定詞組
- 好比:used in many computer(m=3時)因爲in不是合法單詞,故此時沒有知足條件的詞組
- 兩個單詞中穿插多個分隔符,仍是一個詞組嗎
- 好比:answer the question("orange") (m=2時),這時只有1個合法詞組 question("orange
- 幾個合法單詞組成詞組輸出時包含分隔符嗎
- 好比上例,輸出爲<question("orange>:1
- 即輸出的詞組是單詞+分隔符+單詞+……+單詞+分隔符
測試樣例
換行符爲\r\n (CRLF)blog
壓縮文件:測試樣例ip