博客搬家系列(一)-簡介

這個功能思來想去想了好久,終於實現了基本功能,本身基於別人的後臺權限管理系統寫了一個博客系統,其實博客系統只是一小部分,但今天只講博客部分,其餘詳見:html

RZSpider詳見:https://blog.csdn.net/rico_zhou/article/details/83618255    https://www.rzspider.top      U:testadmin   P:testadmin前端

RZBlog詳見:https://blog.csdn.net/rico_zhou/article/details/83617549    https://www.rzspider.top/rzblogjava

 一.簡單介紹

    博客搬家簡單來講就是把例如CSDN,博客園,開源中國等程序員博客彙集地所寫的博客一鍵轉移到本身的博客網站,固然是爬取本身的博客(別人的不是不能,而是不能夠),而且保持樣式儘可能不便,圖片也下載到本身的網站,以及其餘一些設置。本文在前端頁面博客搬家詳情彈窗部分HTML參考了 張亞東博客但僅此而已,後臺的框架代碼均自寫。git

 二.目標

    將CSDN,博客園,開源中國,簡書,以及今日頭條,還有本地WORD文檔以html形式搬家到自有網站,如需修改請使用HTML編輯器,如summernote,並保持基本樣式不便,圖片自轉移。程序員

 三.使用框架

    採用java語言,使用框架htmlunit爬取頁面,使用jsoup解析頁面,對於word文檔則使用poi解析,輔助fastjson。github

    因爲代碼是從項目中截取,雖然可獨立運行,可是可能會有一些無用代碼,敬請見諒!json

    不使用代理,不考慮性能,僅爲簡單實現,見諒!框架

 四.分篇

     博客搬家系列(一)-簡介:http://www.javashuo.com/article/p-ctgxpaub-bu.html編輯器

     博客搬家系列(二)-爬取CSDN博客:http://www.javashuo.com/article/p-eegrpfzv-x.htmlide

     博客搬家系列(三)-爬取博客園博客:http://www.javashuo.com/article/p-hbjeoaya-gc.html

     博客搬家系列(四)-爬取簡書文章:https://blog.csdn.net/rico_zhou/article/details/83619538

     博客搬家系列(五)-爬取開源中國博客:https://blog.csdn.net/rico_zhou/article/details/83619561

     博客搬家系列(六)-爬取今日頭條文章:https://blog.csdn.net/rico_zhou/article/details/83619564

     博客搬家系列(七)-本地WORD文檔轉HTML:https://blog.csdn.net/rico_zhou/article/details/83619573

     博客搬家系列(八)-總結:https://blog.csdn.net/rico_zhou/article/details/83619599

五.搬家圖片預覽

 

 

 

完整源碼請見github:https://github.com/ricozhou/blogmove​​​​​​​