csdn 首頁 博文 简体版
原文   原文鏈接
剛學爬蟲時,爬取了csdn博文,遇到了一個問題,就是正則表達式 須要的是h2標籤裏面那個url 因而就讓pat = '<a href=(.*?)\s+target="_blank"',可是會匹配到多餘的東西,便讓h2做爲惟一標識,^\s*$匹配空行(也嘗試\s+?匹配空格),因而pat = '<h2>^\s*$<a href=(.*?)\s+target="_blank",但什麼也沒有匹配到,便直
>>阅读原文<<
相關文章
相關標籤/搜索
每日一句
    每一个你不满意的现在,都有一个你没有努力的曾经。
本站公眾號
   歡迎關注本站公眾號,獲取更多信息