【爬蟲學習筆記day13】2.非結構化數據與結構化數據提取+非結構化的數據處理+文本、電話號碼、郵箱地址+HTML 文件+結構化的數據處理 +JSON 文件 +XML 文件

文章目錄 2.非結構化數據與結構化數據提取 非結構化的數據處理 文本、電話號碼、郵箱地址 HTML 文件 結構化的數據處理 JSON 文件 XML 文件 2.非結構化數據與結構化數據提取 頁面解析和數據提取 一般來講對我們而言,需要抓取的是某個網站或者某個應用的內容,提取有用的價值。內容一般分爲兩部分,非結構化的數據 和 結構化的數據。 非結構化數據:先有數據,再有結構,(http://www.b
相關文章
相關標籤/搜索