python 去除html 超連接href 如何實現?

今天持久男 在抓取數據的時候發現不少內容都加了錨文本, 這怎麼辦呢? 沒辦法只能經過工具解決html 我是這樣解決的:工具   例如:post   soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>') for a in soup.findAll('a'): del a['href'] prin
相關文章
相關標籤/搜索