Pycharm中安裝Scrapy框架並初始化項目

時間 2019-11-06

標籤 pycharm 安裝 scrapy 框架初始化項目欄目 Python 简体版

原文原文鏈接

前言
Scrapy是一個開源的網絡爬蟲框架，Python編寫的。最初設計用於網頁抓取，也能夠用來提取數據使用API或做爲一個通用的網絡爬蟲。是數據採集不可必備的利器。bash

安裝網絡

pip install scrapy

若是使用上面的命令太慢。國內能夠使用豆瓣源進行加速。框架

pip install -i  https://pypi.douban.com/simple scrapy

注意要寫錯了，是 https://pypi.douban.com/simple 不少包均可以使用這個源進行加速，這也是pip的一個技巧，還能夠使用阿里雲進行加速。scrapy

安裝完成以後在命令行輸入ide

scrapy -v

若是出現了相應的版本號就說明安裝成功。阿里雲

建立項目
目前尚未IDE 可以建立scrapy的項目，咱們必須手動初始化項目。
一、找一個目錄
輸入命令命令行

scrapy startproject SpiderObject

命令行出現這樣的結果說明建立成果設計

You can start your first spider with:
    cd SpiderObject
    scrapy genspider example example.com

去文件夾中看看 code

初始化項目
使用pycharm打開該項目 blog

若是出現這個頁面就說明對了。

下面生成一個模板
打開pycharm的terminal

Terminal中輸入

scrapy genspider BiduSpider http://www.baidu.com

咱們的spider 包下面會多一個文件

這說明咱們的spider建立成功。能夠在pytharm中使用這個強大的框架了。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。