[Python]實戰——百度貼吧爬蟲

網絡爬蟲(Web Spiders)是一個自動提取網頁的程序,它爲搜索引擎從萬維網上下載網頁,是搜索引擎的重要組成。半年前,我接觸了Lucene搜索引擎開發——開始了網絡爬蟲之旅;當時,採用的是純JAVA開發環境,對百度某吧幾百萬帖子進行了全面爬取。那時候我對Python一點都不瞭解,今天對《Pyhon基礎教程:第2版·修訂版》以及極客學院相關視頻進行了學習,造成了本文。html Key Words
相關文章
相關標籤/搜索