一篇文章教會你理解和定義Scrapy爬蟲框架中items.py文件

時間 2021-07-14

原文原文鏈接

在前面幾篇文章中我們已經學會了如何了編寫Spider去獲取網頁上所有的文章鏈接及其對應的網頁目標信息。在這一篇文章中，我們將主要介紹Scrapy中的Item。在介紹Item之前，我們需要知道明確一點，網絡爬蟲的主要目標就是需要從非結構化的數據源中提取出結構化的數據，在提取出結構化的數據之後，怎麼將這些數據進行返回呢？最簡單的一種方式就是將這些字段放到一個字典當中來，然後通過字典返回給Scrap

>>阅读原文<<