HTML解析利器HtmlAgilityPack

在以前的項目中周公曾有解析HTML的情況,當時是採用正則表達式一步步將無關的HTML註釋及JS代碼部分刪除掉,然後再用正則表達式找出需要提取的部分,可以說使用正則表達式來做是一個比較繁瑣的過程,特別是對於正則表達式不是很熟悉或者要處理的HTML很複雜的情況下。前一陣子周公還是通過這個辦法將http://wz.csdn.net/zhoufoxcn上保存的網址導入到http://cang.baidu.
相關文章
相關標籤/搜索