python進行中文字頻、高頻字覆蓋率統計

題目:用python統計《孟子》總體長度、字種、字頻、高頻字覆蓋率。 《孟子》全文下載:點擊下載 高頻字:字頻>=500的字 本題有三個地方要注意: 1、《孟子》中含有大量的標點符號,統計時應該把它們排除在外。 2、統計字頻、高頻字覆蓋率是難點。 3、如何用相對直觀、好看的方式打印輸出結果。 源代碼: #《孟子》總體長度 f = open('ex_menzi.txt', 'r', encoding
相關文章
相關標籤/搜索