畢業論文怎麼降重?有什麼技巧麼?

畢業論文怎麼降重?有什麼技巧麼?算法

論文降重實際上是一件很簡單的事,摸清套路後徹底不須要花費太多精力。可是知乎上目前好像沒有技術帖講清楚,因此我分享一下具體經驗。因爲知網價格很高,終稿以前通常都是用其餘查重網站查重。這裏給出一個評測文章,介紹了十個查重網站,頗有參考價值。親測10個論文查重平臺,告訴你哪一個最靠譜! 我根據這個帖子體驗了幾個查重網站,最終發現確實是papertime和paperfree最爲價廉物美。這兩個網站貌似是同一家公司的,都送新用戶10000+字,因此咱們能夠用包括但不限於父母、叔叔阿姨、爺爺奶奶等全家人的手機號註冊新用戶,而後就不再用花錢了。根據給出的重複對象來源能夠看出這個網站的算法和重複率比較靠譜。構成鮮明對比的是格子達,給出的重複文獻來源能夠與我寫的句子八杆子搭不到邊。最後根據經驗,若是在paperfree/time能降到10如下,在知網應該就穩了。我我的從初稿的20%降到如今的3.76%。(更新:同份文本在學校知網檢測的結果爲1.2%,多是由於知網的單句檢測算法不如papertime嚴格。其實還有降低空間,只不過不必再改了…)值得一提的是,這兩個網站均可以在線改重。對比紅/黃句和重複文獻來源以及句子類似度,能夠針對性地修改,邊改邊查效率很是高。手把手降重攻略1、首先摸清楚查重的算法。Papertime的算法是:整體類似度 = 類似字數 / 檢測字數被系統自動識別出來的非正文部分(如目錄,標題,公式,圖表,參考文獻等)不參與檢測,檢測字數通常略小於論文字數。類似字數 =(句子1字數 * 句子1類似度 + 句子2字數 * 句子2類似度 + ...... + 句子n字數 * 句子n類似度),句子類似度範圍0.00~1.00,綠色句子類似度按照0計算。紅色句子爲重度類似(80%~100%),建議修改;橙色句子爲輕度類似(50%~80%),可酌情修改;綠色句子表示沒有檢測到類似語句。簡單概括:(其中i句類似度>50%爲有效,<50%記做0)簡單理解:查重時把文章分解爲一個個小句,根據某個算法算出單句類似度。把其中類似度大於50%的句子的類似字數加總再除以論文總字數即爲重複率。單句類似度這個概念彷佛比較玄學,網站沒有明確說明算法,可是咱們也能夠簡單理解一下,大概就是「我寫的某個句子和已有文獻句子的相同字數佔該句子總字數的百分比」之類的東西。最重要的一個信息是:類似度>50%的句子纔會被標黃,類似度>80%的句子會被標紅。類似度<50%的被標綠而且類似度被計爲0.2、那咱們的降重目標就很清晰了,一共有兩個途徑:①下降每句類似字數,以下降總類似字數;②把句子的類似度下降到50%如下,那麼這句類似字數直接就變爲0了。咱們發現這兩個途徑其實同樣。可是②的效果更顯著,由於能直接把句子變綠(要堅強)從而大幅降重,因此對於大多數句子,咱們的目標顯然是用方法②把他變綠。。。固然還有一些句子很是堅強,好比「根據圖2-1咱們能夠看到,...」這種句子就比較難綠,可是整體而言難綠的句子很少,因此把重複率降到5%如下是不難的。3、具體措施咱們目前看到的大多數降重思想都侷限在方法①,即沒有目的地用同義詞替換、把字句被字句轉換等方法盡力下降類似字數。可是有了科學思想的指導,咱們的修改方向就更清晰了。1.首要爭取對象——50出頭像這種類似度50%出頭的黃色句子是首要爭取對象,由於只要改幾個字就能變綠,從50直接變成0,於是在降重工程中最受歡迎(你們都爭着綠他,非常可憐)。改爲「這進一步說明了IIT現象更易發生於初始要素稟賦相近的國家間」後,綠化成功。2.短句合併成長句增長分母這種定義引用類的紅色句子,類似度88%,應該無可救藥了吧?可是查重分解句子是會根據標點的,我刪去句子後面的逗號,將短句連成長句以增長該句的分母,對語序作了調整,最終居然硬生生把這句定義給綠化成功了(請叫我綠化小達人)。修改後的句子:「SITC分類規定的相同組別中具備必定生產或消費替代程度的產品的雙向流動」,綠化成功√。我也不知道這樣一改類似度怎麼就降到50%如下了,可是這種思路能夠借鑑,就是短句並長句增長分母。同理也能夠經過擴句增長分母,其精髓在於用本身的語言稀釋乾貨(注水綠化法),以下降類似度。如「A致使了B」改爲「C帶來的A致使了D現象的產生最終形成B的結果」,其中C和D能夠扯得越長越好,這樣句子類似度會大大下降。3.長句分解爲短句棄卒保帥總有些專業詞組幾乎不可能修改,並且在句子中佔的比重過大,須要戰略性地放棄修改這些部分,把他們獨立成一個短句分離出去以方便後面句子的綠化工程。例如:Nuno 和Faustino(2009)運用面板數據模型對葡萄牙和金磚國家貿易中的產業內貿易水平影響因素進行的實證分析代表,一國資源稟賦的數量與該國產業內貿易發展程度存在負相關性。這個長句子開頭部分的「Nuno 和Faustino(2009)...」一堆字符是沒法改變的(名字換成中文也一樣被人寫過了),很是佔空間,即使把後面的內容加長不少也很難把整個句子的類似度降到50%如下。這個時候能夠放棄小部分的降重,把前半句改爲獨立的句子「Nuno 和Faustino(2009)一樣對IIT影響因素進行了研究。」後面也改寫成獨立的句子「他們應用面板數據模型進行的實證研究發現,在葡萄牙與金磚國家的雙邊貿易中,初始的天然資源對該國對外貿易的IIT指數具備負面的影響效應」。這樣雖然前面的句子依然重複,可是捨棄了大段沒法改變的重複字符後,後面的句子就有了被綠化的可能,總體的重複率仍是會下降。4.無可救藥型直接刪去下面這個紅色的句子估計被無數人用過了,你們也極可能已經嘗試過用各類姿式♂綠他,因而知難而退,索性直接刪掉,也不影響文章的意思。4、經驗總結總之在線改重功能很是好用,可是仍存在該網站和知網查重率不一致的問題,在一些狀況下查重率誤差很大。重複率有差別的緣由主要在兩處:一是算法嚴格程度差別;二是網站背後的數據庫大小差別。知網本科論文查重與其餘網站的最大區別在於知網pmlc有【大學生論文聯合對比庫】,這個數據庫收錄了各學校歷年的畢業論文。若是大量引用被知網數據庫收錄而未被其餘網站收錄的語段,那麼在其餘網站檢測出的重複率就會顯著低於知網重複率。可是若是主要內容都是本身認真寫的,那麼知網查重結果和其餘網站結果不會有太大差異。事實上因爲其餘網站爲了彌補數據庫較小的問題,一般會採用更加嚴格的算法使重複率往接近知網的方向修正,所以認真寫的論文在知網的重複率極可能比其餘網站更低。(案例A:某同窗前幾天私信我說paperpass重複率39%,可是他說本身真的是認真寫的。我就建議他在學校知網上試一次,結果出來居然是6.9%(固然在用知網查以前他本身也修改過一些)!這說明在某些狀況下paperpass的算法過於嚴格)相信大多數同窗仍是堅持原創,那麼用paper系列確定能知足需求了,降到5~10%不是什麼難事。對於大量借鑑的同窗來講,在paper系列網站在線改重也是有幫助的。上面的降重技巧也一樣可借鑑。數據庫

相關文章
相關標籤/搜索