爬蟲之正則提取

以豆瓣電影排名前250爲例,我們按f12打開開發者模式,點擊element即可看見該網頁的js代碼,我們點擊出現頁面的左上角的小箭頭,可以找到頁面上每一處的對應源代碼。 如果我想要拔取一條電影信息,則提取一條item即可,如圖。 這裏的class是屬性,因此後面還要加上下劃線
相關文章
相關標籤/搜索