爲何看博客的時候裏面的連接老是 404

爲何看博客的時候裏面的連接老是 404

做爲一個野路子程序員,看大牛的博客是學習,進步的很重要的一個信息來源。
做爲一個信息的匯聚點,博客中總會引用些其餘的經典文章,或是某開源項官方文檔中的重要部分。
然而因爲更新博客是很低頻率的事件,因此隨着時間推移,極可能發生的狀況是:大牛引用的另外一篇文章
已經被刪除,或者乾脆域名到期,引用的博客關門大吉;因爲開源項版本升級,原先的文檔已經不適用於是
官方刪除了。
So, 404...css

現狀

嘗試測試了 阮一峯(http://www.ruanyifeng.com/blog/), 王垠(http://www.yinwang.org/) 等知名博主的博客,發現幾乎都有連接失效的問題。
可見此問題很常見。git

博主

大多數的博主並非經過寫博客盈利賺錢,因此不可能按期去檢查之前博文中的連接是否有效。
話說回來,即使真的是經過寫博客盈利賺錢,那麼多的博文,也不太可能按期去檢查之前博文中的連接是否有效吧。。程序員

讀者

雖然對我很不友好,破壞了上下文和文章的完整性,可是
習慣了。。認了吧。。。湊合看吧。。github

中國特點

因爲衆所周知的緣由,中國讀者遇到引用連接不可訪問的狀況更多,而且不可訪問的連接愈來愈多。服務器

做爲一個獨立開發者,用了若干個第三方服務,CDN 等。天有不測風雲風雲,保不齊哪天哪一個服務商就黃了,或者哪一個 CDN
又被牆了。。。網絡

嘗試解決

一個可能的解決方法 link doctor學習

https://doctor.dry.ninja/測試

博主(站長)在網站註冊後,系統嘗試按期(每6小時1次,可設定)對網站進行一次分析,找出失效的引用的連接,或是失效的引用的資源(js, css),
並將分析結果發送給博主(站長)。網站

目前剛剛有想法作這個東西,並作了個簡單的 Demo。
在檢測的全面性和精準度方面還不作保證。若是真的有博主有這個需求,請收藏、標星。若是沒有人有需求的話,就棄坑了。。
或者有什麼好的建議的話,歡迎提個 issue。blog

github 地址在此:
https://github.com/FingerLiu/...

待解決問題

  • 爬蟲被 ban
  • 因爲國內和國內網絡環境不一樣,分別部署不一樣的服務器
  • 什麼須要檢測什麼不須要
  • 對引用的連接進行備份(snapshot)。
相關文章
相關標籤/搜索