根據網上提供的"CSDN博客導出工具v4.2"源碼修改,可進行博客園博客隨筆導出,以前的源碼只能導出文章。html
微軟面試100題打包,是將本博客中全部的微軟面試100題打包成離線格式,有利於批量查看。web
http://yun.baidu.com/share/home?uk=369664793&view=share#category/type=0面試
Regex reg_title = new Regex(@"href=""(http://www\.cnblogs\.com/.+?/(archive|p)/.+?)"">([^<]+?)</a>", RegexOptions.IgnoreCase | RegexOptions.Compiled);//把以前的articles改成了p工具
int p = 0; for (int i = 1; i < 1000; i++) { if (p > 0 && i > p) break; web.URL = string.Format(url, i); string html = web.Get(); if (p == 0) { var mp = Regex.Match(html, @"共(\d+)頁"); if (mp.Success) p = App.ToInt(mp.Groups[1].Value); else p = 1; }
改成:url
// int p = 0; for (int i = 1; i < 50; i++) { // if (p > 0 && i > p) break; web.URL = string.Format(url, i); string html = web.Get(); // if (p == 0) // { // var mp = Regex.Match(html, @"共(\d+)頁"); // if (mp.Success) p = App.ToInt(mp.Groups[1].Value); // else p = 1; // }
改動以後,基本能夠應付常規下載,遺憾的是速度有點慢。spa