簡單地實現文章的查重

最近想要做一個查重程序,目的是檢測大學生提交的電子文檔的重複率。 最初的想法是是參考之王的論文查重,但是發現他有自己的弊端,也就是說知網論文查重的算法能對標準的論文進行有效的查重。但是對於學生提交的電子檔作業就不一定行了。 我們先來看一下知網論文查重原理: 1:知網論文查重由於是採用了最先進的模糊算法,如果整體結構和大綱被打亂,可能會引起同一處的文章檢測第一次和第二次標紅不一致或者第一次檢測沒有標
相關文章
相關標籤/搜索