學習正則匹配的一些經驗

正則在爬蟲領域使用很普遍,用來把網頁中有價值的文本提取出來。這個提取技術就是用正則匹配。
我感受正則匹配就是類型匹配,當你能認識清楚字符裏面全部包含的類型和結構,那麼你寫出正則也就不難了。如何認識清楚文本中會有什麼類型,看以下連接
https://www.zhihu.com/question/48219401/answer/742444326
在這篇文章中,我建議你認識好 這些基本的:正則表達式

  • 1.元字符
  • 2.限定符
  • 3.分組
  • 4.條件或

認識完這些基礎類型以後,寫正則仍是有點難,
建議跟着以下連接,把裏面的練習都作一下,我包你會有新的感悟
https://juejin.im/post/6844903648309297166
把練習都作完後,一些正常難度的(初、中級)的正則你都能寫了。app

高級或進階,自行學習吧。
https://deerchao.cn/tutorials/regex/regex.htm#regexoptions工具


工具

擁有一個好的調試工具,會讓你能方便快捷的調試你的正則語句,這種及時的反饋感很重要,特別是新手的你。post

bbedit下載地址
https://apps.apple.com/cn/story/跟-bbedit-學正則表達式/id1485320067學習

使用截圖:
調試

相關文章
相關標籤/搜索