PyCharm調試運行Scrapy教程

時間 2019-11-13

標籤 pycharm 調試運行 scrapy 教程欄目 Python 简体版

原文原文鏈接

1、使用scrapy建立一個項目

這裏使用scrapy官方第一個示例html

scrapy startproject tutorial

使用PyCharm打開項目，在tutorial/tutorial/spiders目錄下建立quotes_spider.py文件並寫入，如下代碼scrapy

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"

    def start_requests(self):
        urls = [
            'http://quotes.toscrape.com/page/1/',
            'http://quotes.toscrape.com/page/2/',
        ]
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'quotes-%s.html' % page
        with open(filename, 'wb') as f:
            f.write(response.body)
        self.log('Saved file %s' % filename)

View Code

2、複製cmdline.py到項目主目錄

找到scrapy下的cmdline.py文件（好比我這裏是D:\Language\Miniconda3\envs\default\Lib\site-packages\scrapy\cmdline.py）ide

複製一份到tutorial項目的根目錄下（scrapy.cfg文件的同一目錄下）url

3、編緝文件調試運行配置

Name--和上邊建立的spider文件相同，我這裏叫quotes_spiderspa

Script path--選擇當前項目下的cmdline.py，我這裏是F:\PycharmProjects\tutorial\cmdline.py3d

Parameters--crawl+要調試運行的spider名稱，我這裏是crawl quotes調試

Working directory--填項目所在主目錄，我這裏是F:\PycharmProjects\tutorialcode

最後要注意點「Apply」，不要直接點「OK」htm

4、調示和運行演示

選擇調試，程序成功停在斷點處blog

選擇運行，程序也成功通行

相關文章

相關標籤/搜索

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<