R語言爬蟲系列5|正則表達式與字符串處理函數

無論是R中的RCurl組件還是Python的BeautifulSoup庫,對網頁HTML完成下載解析之後我們從這些看似雜亂無章的文本中拿到我們感興趣的數據。之前在系列2的時候小編就已經跟大家介紹過HTML/XML專用工具XPath表達式,今天小編需要跟大家介紹一款更爲通用、更加底層的文本信息提取工具——正則表達式。   所謂正則表達式,即使用一個字符串來描述、匹配一系列某個語法規則的字符串。通過特
相關文章
相關標籤/搜索