今天持久男 在抓取數據的時候發現不少內容都加了錨文本, 這怎麼辦呢? 沒辦法只能經過工具解決工具
我是這樣解決的:google
例如:spa
soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>') for a in soup.findAll('a'): del a['href'] print (soup) 結果: <p>Hello <a>Google</a></p>
成功了.code