網絡爬蟲基礎練習

5.練習:spa

取出h1標籤的文本code

print(soup.h1.text)


取出a標籤的連接blog

for link in soup.select('a'):
    print(link.get('href'))


取出全部li標籤的全部內容get

for i in soup.select('li'):
    print(i.contents[1])

 


取出一條新聞的標題、連接、發佈時間、來源it

print(soup.select('.news-list-title')[0].text)
print(soup.select('li')[0].a.attrs['href'])
print(soup.select('.news-list-info')[0].contents[0].text)
print(soup.select('.news-list-info')[0].contents[1].text)
相關文章
相關標籤/搜索