Scrapy中的Request和日誌分析

Scrapy.http.Request框架

自動去重,根據url的哈希值,進行去重scrapy

 

屬性函數

meta(dict)       在不一樣的請求之間傳遞數據,dictpost

priority(int)      此請求的優先級(默認爲0)編碼

dont_filter(boolean)  關閉自動去重url

errback(callable)    在處理請求時引起任何異常時將調用的函數spa

flags(list)        發送給請求的標誌,可用於日誌記錄或相似目的debug

 

方法日誌

copy()     返回一個新的請求,改請求是此請求的副本orm

replace()      返回一個更新對的request

 

 

 

FormRequest

scrapy框架內置了一個FormRequest類,它擴展了基類Request,具備處理HTML表單的功能

post請求的時候,使用FormRequest將數據傳入formdata參數便可

 

 

 

日誌使用

LOG_FILE         日誌輸出文件,若是爲None,就打印在控制檯

LOG_ENABLED        是否啓用日誌,默認True

LOG_ENCODING          日期編碼,默認utf-8

LOG_LEVEL        日誌等級,默認debug

LOG_FORMAT       日誌格式

LOG_DATEFORMAT     日誌日期格式

LOG_STDOUT       日誌標準輸出,默認False,若是True全部標準輸出都將寫入日誌中

LOG_SHORT_NAMES     短日誌名,默認爲False,若是True將不輸出組件名

 

通常只在settings配置文件中添加

相關文章
相關標籤/搜索