一看就明白的爬蟲入門講解-基礎理論篇(上篇)

作者:孔淼 關於爬蟲內容的分享,我會分成兩篇,六個部分來分享,分別是: 1)  我們的目的是什麼 2)  內容從何而來 3)  瞭解網絡請求 4)  一些常見的限制方式 5)  嘗試解決問題的思路 6)  效率問題的取捨 本文先聊聊前三個部分。 一、我們的目的是什麼 一般來講對我們而言需要抓取的是某個網站或者某個應用的內容,提取有用的價值,內容一般分爲兩部分,非結構化的文本,或者結構化的文本。 1
相關文章
相關標籤/搜索