爬蟲採集 通用正則表達式

提取HTML <a>標籤 href屬性:(?<=href=("|'))[^("|')]*?(?=("|')) 說明:在 herf=("或') 之後,0或多個非("或') 字符但儘可能少,在 ("或') 之前。 提取HTML <a>標籤的innerHTML2:(?<=(<a.*?>)).*?(?=</a>)  在java中改爲(?<=(<a.{0,500}?>)).*?(?=</a>) 提取HTML
相關文章
相關標籤/搜索