爬蟲(一)jupyter環境安裝

1、什麼是Jupyter Notebook?

1. 簡介

Jupyter Notebook是基於網頁的用於交互計算的應用程序。其可被應用於全過程計算:開發、文檔編寫、運行代碼和展現結果。——Jupyter Notebook官方介紹html

簡而言之,Jupyter Notebook是以網頁的形式打開,能夠在網頁頁面中直接編寫代碼和運行代碼,代碼的運行結果也會直接在代碼塊下顯示。如在編程過程當中須要編寫說明文檔,可在同一個頁面中直接編寫,便於做及時的說明和解釋。python

2. 組成部分

① 網頁應用

網頁應用即基於網頁形式的、結合了編寫說明文檔、數學公式、交互計算和其餘富媒體形式的工具。簡言之,網頁應用是能夠實現各類功能的工具。nginx

② 文檔

即Jupyter Notebook中全部交互計算、編寫說明文檔、數學公式、圖片以及其餘富媒體形式的輸入和輸出,都是以文檔的形式體現的。sql

3. Jupyter Notebook的主要特色

  1. 編程時具備語法高亮、縮進、tab補全的功能。macos

  2. 可直接經過瀏覽器運行代碼,同時在代碼塊下方展現運行結果。編程

  3. 對代碼編寫說明文檔或語句時,支持Markdown語法。瀏覽器

2、安裝Jupyter Notebook

1. 安裝

① 安裝前提

安裝Jupyter Notebook的前提是須要安裝了Python(3.3版本及以上,或2.7版本)。服務器

② 使用Anaconda安裝

若是你是小白,那麼建議你經過安裝Anaconda來解決Jupyter Notebook的安裝問題,由於Anaconda已經自動爲你安裝了Jupter Notebook及其餘工具,還有python中超過180個科學包及其依賴項。markdown

你能夠經過進入Anaconda的官方下載頁面自行選擇下載;若是你對閱讀英文文檔感到頭痛,或者對安裝步驟一無所知,甚至也想快速瞭解一下什麼是Anaconda,那麼能夠前往個人另外一篇文章Anaconda介紹、安裝及使用教程。你想要的,都在裏面!工具

常規來講,安裝了Anaconda發行版時已經自動爲你安裝了Jupyter Notebook的,但若是沒有自動安裝,那麼就在終端(Linux或macOS的「終端」,Windows的「Anaconda Prompt」,如下均簡稱「終端」)中輸入如下命令安裝:

conda install jupyter notebook 

③ 使用pip命令安裝

若是你是有經驗的Python玩家,想要嘗試用pip命令來安裝Jupyter Notebook,那麼請看如下步驟吧!接下來的命令都輸入在終端當中的噢!

  1. 把pip升級到最新版本

    • Python 3.x
    pip3 install --upgrade pip 
    • Python 2.x
    pip install --upgrade pip 
  • 注意:老版本的pip在安裝Jupyter Notebook過程當中或面臨依賴項沒法同步安裝的問題。所以強烈建議先把pip升級到最新版本。
  1. 安裝Jupyter Notebook

    • Python 3.x
    pip3 install jupyter 
    • Python 2.x
    pip install jupyter 

3、運行Jupyter Notebook

0. 幫助

若是你有任何jupyter notebook命令的疑問,能夠考慮查看官方幫助文檔,命令以下:

jupyter notebook --help 

jupyter notebook -h 

1. 啓動

① 默認端口啓動

在終端中輸入如下命令:

jupyter notebook 

執行命令以後,在終端中將會顯示一系列notebook的服務器信息,同時瀏覽器將會自動啓動Jupyter Notebook。

啓動過程當中終端顯示內容以下:

$ jupyter notebook
[I 08:58:24.417 NotebookApp] Serving notebooks from local directory: /Users/catherine [I 08:58:24.417 NotebookApp] 0 active kernels [I 08:58:24.417 NotebookApp] The Jupyter Notebook is running at: http://localhost:8888/ [I 08:58:24.417 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation). 
  • 注意:以後在Jupyter Notebook的全部操做,都請保持終端不要關閉,由於一旦關閉終端,就會斷開與本地服務器的連接,你將沒法在Jupyter Notebook中進行其餘操做啦。

瀏覽器地址欄中默認地將會顯示:http://localhost:8888。其中,「localhost」指的是本機,「8888」則是端口號。

URL

 

若是你同時啓動了多個Jupyter Notebook,因爲默認端口「8888」被佔用,所以地址欄中的數字將從「8888」起,每多啓動一個Jupyter Notebook數字就加1,如「8889」、「8890」……

② 指定端口啓動

若是你想自定義端口號來啓動Jupyter Notebook,能夠在終端中輸入如下命令:

jupyter notebook --port <port_number> 

其中,「<port_number>」是自定義端口號,直接以數字的形式寫在命令當中,數字兩邊不加尖括號「<>」。如:jupyter notebook --port 9999,即在端口號爲「9999」的服務器啓動Jupyter Notebook。

③ 啓動服務器但不打開瀏覽器

若是你只是想啓動Jupyter Notebook的服務器但不打算馬上進入到主頁面,那麼就無需馬上啓動瀏覽器。在終端中輸入:

jupyter notebook --no-browser 

此時,將會在終端顯示啓動的服務器信息,並在服務器啓動以後,顯示出打開瀏覽器頁面的連接。當你須要啓動瀏覽器頁面時,只須要複製連接,並粘貼在瀏覽器的地址欄中,輕按回車變轉到了你的Jupyter Notebook頁面。

 

例圖中因爲在完成上面內容時我同時啓動了多個Jupyter Notebook,所以顯示個人「8888」端口號被佔用,最終分配給個人是「8889」。

2. 快捷鍵

  1. 向上插入一個cell:a
  2. 向下插入一個cell:b
  3. 刪除cell:x
  4. 將code切換成markdown:m
  5. 將markdown切換成code:y
  6. 運行cell:shift+enter
  7. 查看幫助文檔:shift+tab
  8. 自動提示:tab

3. 魔法指令

  1. 運行外部python源文件:%run xxx.py
  2. 計算statement的運行時間:%time statement
  3. 計算statement的平均運行時間:%timeit statement
  4. 測試多行代碼的平均運行時間:

    %%timeit

    statement1

    statement2

    statement3

相關文章
相關標籤/搜索