python爬蟲(一)

主要內容 什麼是爬蟲 爲什麼推薦使用Python寫爬蟲 Python開發環境搭建和簡介 HTTP簡介 HTML/XML/Json簡介 MySQL/Apache安裝和配置 爬蟲框架介紹 robots規範與爬蟲原則 1、什麼是爬蟲 定義 網絡爬蟲(又被稱爲網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱爲網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字
相關文章
相關標籤/搜索