python網絡爬蟲實戰1——基礎篇

一、意義       很多數據並沒有存在自家的數據庫中,在大數據時代,很多的數據都放在網絡上,以網頁的形式呈現給大家。我們如何將這些沒有固定格式的非結構化數據批量從網絡上拷貝下來,並提供給後來者進行數據價值的挖掘,是一件非常有意義的事情。這裏,我們必須藉助ETL(extract,transformation,loading)三個方法將這些數據轉化成結構化數據取用。     網絡上有許多網頁諮詢,如
相關文章
相關標籤/搜索