python——利用正則表達式爬取豆瓣讀書中的圖書信息

原本可使用一條正則表達式完成圖書信息的爬取,結果發如今CPU性能較差的電腦上進行爬取時耗時很是長,幾乎沒法將結果獲取到。因此,將大的html源碼先通過一次簡單的匹配以獲取到一箇中間結果,而後再從中間結果中依次進行匹配。結果發現按照這個步驟,即便使用循環也能很是快速的獲取到圖書信息。(最後的代碼爲使用進程池,結果發現效果不佳)html   步驟簡介以下:python       使用requests
相關文章
相關標籤/搜索