python爬蟲實戰(2)--爬取百度貼吧

本篇目標 1.對百度貼吧的任意帖子進行抓取 2.指定是否只抓取樓主發帖內容 3.將抓取到的內容分析並保存到文件 1.URL格式的確定 先觀察百度貼吧url格式,以中南財經政法大學迎新帖爲例,URL我們劃分基礎部分是 http://tieba.baidu.com/p/5174106966,參數部分是 ?see_lz=1&pn=1 2.頁面的抓取 一個初始化方法,一個獲取頁面的方法。另外,獲取頁面的方
相關文章
相關標籤/搜索