Python數據抓取(1) —數據處理前的準備

(一)數據抓取概要 爲什麼要學會抓取網絡數據? 對公司或對自己有價值的數據,80%都不在本地的數據庫,它們都散落在廣大的網絡數據,這些數據通常都伴隨着網頁的形式呈現,這樣的數據我們稱爲非結構化數據 如果我們能想出辦法,把這些非結構化的數據轉化爲結構化的數據,在跟自己的本地數據庫做匹配,做交叉分析,讓它們關聯起來,從而我們就能提煉出我們需要的有價值的數據。 如何將非結構化的數據轉化爲結構化的數據呢?
相關文章
相關標籤/搜索