GIT地址 | 點擊查看 |
結對夥伴 | 陳紀龍201831061109 |
在閱讀過做業要求後,想到了python中列表和詞典的功能,詞典的結構正好能夠來存儲記錄單詞頻率和詞組頻率。但涉及到命令行操做的不怎麼懂。
具體代碼設計及編程思想體現過程請移步結對夥伴陳紀龍同窗的博客html
在代碼編寫後咱們進行了複審,針對函數的參數傳遞作了一些更改,讓命令行參數與函數接口能更好的對接。同時在複審過程當中發現了本身在註釋以及一些代碼思路上的問題,在陳紀龍同窗的幫助下進行了改正。python
單元測試利用的是python自帶的unitest部分進行測試。
過程以下
覆蓋率統計本身下載coverage插件進行的代碼覆蓋率統計
在cmd命令行運行結果以下
這裏的覆蓋率結果查詢資料後仍是不甚明瞭,不知道該怎麼單元測試用例纔能有效提高覆蓋率。git
性能測試
github
兩個測試圖像代表Wordgroup函數耗費最大。寫這個函數的時候我想到的是利用列表能夠連續讀取的特性,利用循環將每次讀取的區間進行更新,從而得到指定長度詞組,。在利用join函數將列表讀取出來的詞組轉化爲字符串作爲關鍵字。再利用詞組的get方法獲取詞組出現的頻率。
形成耗費大的緣由應該是循環中嵌套了對列表轉字符串的操做以及對詞組頻率的統計
但願能有更好的方法編程
運行結果
ide
參考陳紀龍的博客
函數
在這次結對編程做業中,陳紀龍同窗出了不少力,咱們兩個都有python基礎,可是在結對過程能夠明顯感受到夥伴的效率逼我高不少,我想是由於個人代碼量較少,不少都沒進行實際操做,看來實踐是檢驗技術的惟一標準。在紀龍同窗的幫助下我收穫了不少,包括學會了一些沒學過的技術,以及面向對象的基礎思想,最終順利完成了這次編寫做業,由衷地體會到告終對編程地「1+1>2」。
性能