爬蟲入門到精通-開始爬蟲之旅

時間 2019-11-08

標籤爬蟲入門精通開始之旅欄目網絡爬蟲简体版

原文原文鏈接

開始爬蟲之旅

本文章屬於爬蟲入門到精通系統教程第一講segmentfault

引言

我常常會看到有人在知乎上提問如何入門 Python 爬蟲？、Python 爬蟲進階？、利用爬蟲技術能作到哪些很酷頗有趣頗有用的事情？等這一些問題，我寫這一系列的文章的目的就是把個人經驗告訴你們。瀏覽器

什麼是爬蟲?

引用自維基百科網絡

網絡蜘蛛（Web spider）也叫網絡爬蟲（Web crawler），螞蟻（ant），自動檢索工具（automatic indexer），或者（在FOAF軟件概念中）網絡疾走（WEB scutter），是一種「自動化瀏覽網絡」的程序，或者說是一種網絡機器人。它們被普遍用於互聯網搜索引擎或其餘相似網站，以獲取或更新這些網站的內容和檢索方式。它們能夠自動採集全部其可以訪問到的頁面內容，以供搜索引擎作進一步處理（分檢整理下載的頁面），而使得用戶能更快的檢索到他們須要的信息。app

個人理解就是能夠自動的抓取數據ide