1、引言html
古語有云:「活到老學到老」。表達出一種「生命不止,學習不止」的學習進取精神,是一種樂觀的激勵!做爲程序員更應該如此,不然就會被淘汰。今天我所要講的不是如何去學習,而是怎麼在網上找到咱們所需求的資源。程序員
2、百度網盤搜索方法正則表達式
找資源的方法有不少,如:百度,谷歌搜索。而我講的是如何搜索「百度網盤」裏面的資源。
工具
具體方法:在搜索引擎中搜索:site:pan.baidu.com 關鍵詞,以下圖。親測必應,谷歌能夠。學習
3、寫了一個程序搜索引擎
爲了本身搜索方便,索性寫了一個程序去爬取必應的搜索結果,以下圖。演示地址:http://pan.tianyouduo.com
google
4、程序介紹url
一、經過抓包工具,分析必應搜索的url,以下圖。咱們最終能夠獲取到:http://cn.bing.com/search?q=關鍵詞&first=第幾條開始spa
二、向此url(http://cn.bing.com/search?q=site:pan.baidu.com 關鍵詞&first=第幾條開始)發起Http請求(GET方式),獲得html,經過正則表達式和xPath解析源代碼,提取信息。3d
三、代碼概覽。
*DotNet.Http.Core:Http請求專用庫。
*Resouces.Crawl.Common:一些.Net擴展方法。
*Resource.Crawl.Services:解析Html源代碼,並返回信息的庫。
*Resource.Crawl.Web:展現層。
5、源碼下載(Visual Studio 2013)