搜索引擎是怎麼刪除重複網頁的

時間 2021-01-01

原文原文鏈接

百度曾在站長貼吧裏做過這樣一個回覆：從用戶體驗角度，「有些轉載未必比原創差」。比方一篇科技原創博文，被知名門戶網站的科技頻道轉載。如果這種轉載保留原創者姓名和出處鏈接，實際上對原創者是有利的，因爲起到了更好的傳播效果。只是國內的轉載，很多是掐頭去尾，使原創者比較受傷。據資料表明近似重複網頁的數量佔網頁總數的的比較高達全部頁面的29%，而完全相同的頁面大約佔全部頁面的22%。很多站長都會抱怨，