Python每日一練(18)-抓取小說目錄和全文

本文要實現的案例是經過 requests 庫抓取 鬥破小說網 上指定的小說的目錄和每一節的完整內容(只保留純文本內容)。當抓取包含目錄和小說內容的頁面後,會經過正則表達式分析 HTML 代碼,並提取出目錄標題,對應的 url 以及文本形式的小說內容。如今進入鬥破小說網,選擇一篇小說,本文選擇了 鬥破蒼穹 目錄頁面以下圖所示: 真是歲月催人老呀,懷念當年偷偷捂着被子,逃課看這本小說的年紀。這部小說的
相關文章
相關標籤/搜索