python BeautifulSoup 爬蟲運行出現 exited with code -1073741571

首先,exited with code -1073741571意思是棧溢出。具體能夠看https://blog.csdn.net/vblittleboy/article/details/6613815html

它的前一個錯誤是程序遞歸深度過深。python

但我沒有在函數裏用遞歸?windows

python認爲你進入一個函數就進入更深一層的遞歸。函數

import sys#出現遞歸深度太深的問題?
sys.setrecursionlimit(100000000)#把遞歸深度設深點。

能夠解決,spa

但又出現棧溢出。在隔行輸出調試法下我發現是<class 'bs4.element.Tag'>類型強制轉換str處退出的程序。也就是說,它致使了棧溢出。.net

soup = BeautifulSoup(html, 'html.parser') pbiaoqian = soup.find('p') print(str(pbiaoqian))#有問題?

在這個錯誤以前,有一個問題,就是一個htm頁面有不少<p>標籤,但BeautifulSoup只要找一個就全在裏面了。調試

以前用code

for pbiaoqian in soup.find_all('p'): #prind(pbiaoqian.get_text())#調用方法
    #print(str(pbiaoqian))#或者直接轉換打印
    print(pbiaoqian)#這樣也能顯示

它輸出的結果是find到的第一個<p>標籤,從頭輸出到尾。第二個輸出,find到的第二個<p>標籤開始,到尾。......最後一個<p>標籤。htm

言歸正傳。blog

我推測,棧溢出是由於調用強制類型轉換程序次數過多致使的,或者pbiaoqian裏內容過多類型轉換處理不了。

那麼,解決方法就是:

1.報什麼錯從哪裏解決。

  但windows修改棧空間大小要在編譯器裏修改,由於它是由編譯器自動管理的。但F:\PyCharm Community Edition 2018.2.4\bin\pycharm.exe.vmoptions裏滿是看不懂的參數,前2個好像仍是系統給編譯器分配的內存設置。

  File->settings瞎點了半天,也沒有找到Stack有關的單詞。

2.讓str的強制類型轉換能一次轉更多。

  若是能像設置遞歸深度同樣設置棧空間大小就行了,

threading.stack_size(200000000)

  不過用起來好像沒什麼效果,仍是老樣子。

3.或者讓BeautifulSoup一次不find那麼多,或者把find到的拆分紅許多塊。

  str拆分還能百度到方法,BeautifulSoup文檔裏給它4個變量的介紹少得可憐,也沒有百度到。

思考一天未果。

也許你有一樣困擾,也許你能給我答案,能夠在下面評論。

原文出處:https://www.cnblogs.com/Zf451452043/p/10129943.html

相關文章
相關標籤/搜索