第一課 Python爬蟲初識與網絡請求

Python爬蟲學習第一課記錄 1.非結構化數據: 如圖的網頁資料/文章,因此我們需要挖掘有價值的數據,那麼這個時候我們需要通過ETL(Extract,Transformation,Loading)工具才能將數據轉化爲結構化數據之後,數據纔可以的有效的利用。 2.ETL: 原始資料->ETL腳本->結構化數據 食材->廚師->美食 3.如何處理非結構化數據 將新聞列表的標題、摘要、圖片抓取下來。
相關文章
相關標籤/搜索