Python爬蟲實戰(2):百度貼吧帖子

大家好,上次我們實驗了爬取了糗事百科的段子,那麼這次我們來嘗試一下爬取百度貼吧的帖子。與上一篇不同的是,這次我們需要用到文件的相關操作。 本篇目標 1.對百度貼吧的任意帖子進行抓取 2.指定是否只抓取樓主發帖內容 3.將抓取到的內容分析並保存到文件 1.URL格式的確定 首先,我們先觀察一下百度貼吧的任意一個帖子。 比如:http://tieba.baidu.com/p/3138733512?se
相關文章
相關標籤/搜索