python——博客園首頁信息提取與分析(轉載有改動)

昨天看到了這篇文章,挺感興趣的,早就知道python功能很強大,抓取網站信息很方便,一直沒有用過,就好好分析了一下,在原作者的基礎上修改了一下,也實現了博客園首頁信息的提取,主要提取的是關於文章的標題、作者、發佈時間、評論、閱讀幾個屬性。 獲取不同頁面的html數據: 1 import os,urllib,sys 2 class LinkParser: 3 def __init__(
相關文章
相關標籤/搜索