Python 開發簡單爬蟲 - 基礎框架

Python 開發簡單爬蟲 - 基礎框架 1. 目標:開發輕量級爬蟲(不包括需登陸的 和 Javascript異步加載的)   不需要登陸的靜態網頁抓取 2. 內容:   2.1 爬蟲簡介   2.2 簡單爬蟲架構   2.3 URL管理器   2.4 網頁下載器(urllib2)   2.5 網頁解析器(BeautifulSoup)   2.6 完整實例:爬取百度百科Python詞條相關的100
相關文章
相關標籤/搜索