網絡爬蟲基礎練習

時間 2019-11-20

原文原文鏈接

5.練習：spa

取出h1標籤的文本code

print(soup.h1.text)

取出a標籤的連接blog

for link in soup.select('a'):
    print(link.get('href'))

取出全部li標籤的全部內容get

for i in soup.select('li'):
    print(i.contents[1])

取出一條新聞的標題、連接、發佈時間、來源it

print(soup.select('.news-list-title')[0].text)
print(soup.select('li')[0].a.attrs['href'])
print(soup.select('.news-list-info')[0].contents[0].text)
print(soup.select('.news-list-info')[0].contents[1].text)

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。