python 去除html 超連接href 如何實現?

今天持久男 在抓取數據的時候發現不少內容都加了錨文本, 這怎麼辦呢? 沒辦法只能經過工具解決工具

我是這樣解決的:google

 

例如:spa

 

soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>') 
for a in soup.findAll('a'):
 del a['href'] 
 print (soup) 

結果:
<p>Hello <a>Google</a></p>

  

成功了.code

相關文章
相關標籤/搜索